Thứ Năm, 17 tháng 6, 2010

Số thống kê, trời ơi!

Tôi chẳng bao giờ nghĩ mình sẽ viết entry về thống kê trên blog này. Đơn giản là vì blog này tôi vốn lập ra để dành cho con người văn thơ của tôi, con người thiên về não phải ấy. Còn con người của não trái, của công việc, của logic, của số liệu vv thì đã có chỗ khác để thể hiện rồi - cái blog ncgdvn.blogspot.com ấy (tranh thủ tự quảng cáo tí!).

Nhưng hôm nay, chẳng hiểu bị cái gì mà tôi đụng đâu cũng thấy thống kê. Mà toàn là những con số làm tôi "bức xúc" mới nói chứ! Gì chứ bức xúc, suy nghĩ theo kiểu cảm tính hoàn toàn, thì phải đưa lên blog này, chứ không thể đưa lên ncgdvn được - dù gì thì nơi đó cũng là bộ mặt professional của tôi, phải giữ cho nó ... đàng hoàng chút! ;-)

Quay lại vụ "thống kê". Trước hết, hôm nay là ngày tôi đi dạy, dạy nhập môn thống kê. Nói đúng hơn, phải nói là dạy Thống kê cho người dốt toán, và được dạy bởi người dốt toán, là tôi đây!

Đã dạy thống kê giáo dục, thì cố nhiên là tôi phải lấy ví dụ về thống kê trong giáo dục. Mà rất may, lúc này quốc hội đang họp, vừa mới xong đợt họp về các vấn đề giáo dục. Nên tôi tha hồ lấy những ví dụ về những sai lầm vô tình hoặc cố ý liên quan đến những con số thống kê giáo dục của VN. Ví dụ như gần đây có một đại biểu nào đó nhắc đến thu nhập của giáo viên, và hình như là PTT Nguyễn Thiện Nhân đã trả lời rằng thu nhập của giáo viên hiện nay là trong khoảng từ 2.5 triệu đến 4 triệu gì đó, tôi không nhớ rõ.

Nhận xét của tôi sáng nay là: với một biến khoảng cách liên tục như tiền lương, thì tại sao PTT không sử dụng mức lương trung bình, mà lại sử dụng khoảng (range) từ 2.5 triệu đến 4 triệu làm gì? Vì nó không cho ta biết, ví dụ, phải chăng là 80% giáo viên lãnh lương 2.5 triệu, và 20% lãnh 4 triệu, hay ngược lại? Hay một tỷ lệ phần trăm nào khác?

Nhưng ấn tượng hơn là chiều nay tôi đọc được một bài tổng kết về giáo dục VN trong 4 năm PTT Nguyễn Thiện Nhân làm bộ trưởng. Những con số hết sức ấn tượng, chi li đến từng số lẻ. Và những kết luận còn ấn tượng hơn nhiều: toàn là những tiến bộ, thậm chí là tiến bộ vượt bậc.

Nếu quả những kết luận trong báo cáo trên là đúng, thì có lẽ giáo dục VN sắp khởi sắc, và đất nước sắp thành rồng thành cọp rồi đó. Ăn mừng đi, mọi người ơi! Mà cũng thật tiếc, tôi chỉ còn có 5 năm nữa là về hưu mà thôi. Không còn nhiều thời gian để chờ đến ngày nhà giáo ung dung sống bằng đồng lương chính đáng của mình, và ngành giáo được cả xã hội kính trọng, hẳn là thế.

Nhưng, vì là người dạy thống kê mà, nên cũng hơi thắc mắc: có cách nào kiểm tra sự chính xác của những con số trong báo cáo trên không nhỉ? Ừ mà có một chi tiết tôi tin là mình có thể kiểm tra được ngay: số lượng truy cập trang điện tử của tờ báo của ngành, báo giáo dục và thời đại.

Con số được đưa ra trong báo cáo nêu trên là: số lượng truy cập vào trang báo điện tử này là 110.000 lượt/ngày. Nghe cho kỹ nhé: một trăm mười ngàn lượt một ngày! Ấn tượng chưa!

Tôi tò mò vào các trang page rank để tìm hiểu. Tôi lấy những trang mà tôi biết, ví dụ: trang blog bshohai.blogspot.com, trang nguyenvantuan.net, trang ncgdvn.blogspot.com và trang này, bloganhvu.blogspot.com, và một vài trang nữa.

Trước hết, nói về các trang của tôi. Trang bloganhvu này tôi có cài công cụ đếm lượng truy cập (google analytics), và số liệu của google analytics cho tôi biết là trang của tôi có khoảng vài trăm lượt truy cập một ngày. Trang ncgdvn cũng thế, trung bình vài trăm lượt, thảng hoặc có bài gì "nóng hổi", scandalous thì tăng lên được trên một ngàn, là giỏi lắm rồi.

Trang bshohai cách đây ít lâu có lần tôi hỏi thì ông nói, cao lắm là khoảng chục ngàn lượt ra vào một ngày gì đó.

Trang nguyenvantuan.net thì có ghi rõ số lần truy cập từ 16/5 đến giờ là hơn 150 ngàn lượt truy cập, vậy trung bình là 5000 lượt truy cập một ngày.

Còn trang giáo dục và thời đại, nhớ nhé, có đến hơn 100 ngàn người truy cập một ngày!!!! Gấp 10 lần trang bshohai (vốn có vẻ khá hot?), gấp 20 lần trang nguyenvantuan, và gấp gần 1000 lần trang của tôi. (Đúng rồi còn gì, trang báo của cả ngành, tôi chỉ là một cá nhân, một hộ cá thể, "sản xuất nhỏ, lẻ", bì làm sao được!)

Vậy pagerank của những trang này ra sao? Dưới đây là các kết quả, và hình chụp các trang kết quả đó:

1. Trang ncgdvn của tôi: alexa page rank hạng trên 5 triệu (xấu hổ quá, thế này thì rao bán trang blog của mình để lấy tiền làm sao được nhỉ?). Hình chụp dưới đây.

2. Trang bshohai: alexa page rank hạng trên 500 ngàn (bỏ qua trang web của tôi xa tít mù tắp). Cũng phải thôi, nhìn followers (người theo dõi) của ông ấy đông thế còn gì, gần 150 người rồi. Hình page rank đây nè.

3. Trang nguyenvantuan: Theo tôi, trang này cũng rất hot. Tôi đã lặng lẽ đọc trang này nhiều năm rồi (trang cũ), và cũng chỉ cho nhiều sinh viên của tôi đọc, đặc biệt là các bài về thống kê hay về giáo dục. À mà này, các bài viết về thống kê của ông hay đáo để, rất đáng đọc, nhất là các bài thống kê giáo dục, thật đấy. Page rank trang này cũng là vài trăm ngàn gì đấy, đâu đó ngang ngửa với trang bshohai, hình dưới đây.

4. Còn đây là trang mà tôi quan tâm, trang điện tử của báo giáo dục và thời đại. Hình dưới đây.

Chỉ có điều là, sau khi tôi có được kết quả page rank của trang này, thì tôi cứ bần thần mãi cho đến giờ. Vì ... nó lạ quá! Hạng của trang này đến sao lại thấp hơn đến mấy trăm ngàn so với các trang bshohai và nguyenvantuan, vốn đều có lượng truy cập không đến 1/10, thậm chí chỉ 1/20 của trang giáo dục thời đại?

Tôi bần thần, là vì tôi không thể quyết định được ai đang có vấn đề về thống kê đây? Tôi, alexa page rank tool, hay tác giả của bài viết, hay người đã cung cấp số liệu cho tác giả viết bài? Hay là tại trang vietnamnet bị nhầm?

À, đúng rồi, có thế mà nghĩ mãi không ra: đây là ... lỗi đánh máy, đúng quá rồi!

Có thế chứ! Đúng là tôi lẩn thẩn rồi, thật thế!

10 nhận xét:

  1. Chi PA,
    Nếu em không lầm thì trong số lượng "người vào" đó có "search engine" (con bọ tìm kiếm). Lượt truy cập của "bọ" rất nhiều với mục đích tìm kiếm thông tin để đưa ra kết luận đánh giá trang web; xếp thứ bậc trên, dưới mỗi khi mình tìm gì đó trên google.
    Vì vậy, số lượt truy cập không phải tất cả là người. Tuy nhiên, không thể phủ nhận là blog của bác Hải và Giáo sư Tuấn (có rank ngang nhau) được nhiều người quan tâm.
    Trang web nhiều người vào chưa chắc đã phải trang web đúng và hay, như nhà có nhiều người đến chơi chưa chắc đã phải nhà đẹp.
    Song, đó là một trong những tiêu chí quan trọng để đánh giá chất lượng trang web.
    Vài ý kiến nhỏ, có gì sai, mong chị thông cảm mà sửa cho.
    HQ

    Trả lờiXóa
  2. Hi Quang,

    Chị có biết gì đâu mà dám sửa em? Mấy thông tin em đưa ra chị phải học đấy chứ?

    Nhưng chị nghĩ đơn giản: lượng truy cập, dù là người truy cập hay bọ truy cập, thì cũng được tính như nhau cả thôi phải không em? Vậy ai được truy cập nhiều hơn thì hẳn rank phải cao hơn chứ?

    Cớ sao bshohai va nguyenvantuan có page rank cao hơn mà lại có lượng truy cập thấp hơn nhiều so với giáo dục và thời đại?

    Còn tất nhiên lượng truy cập cao hơn có nghĩa gì thì lại là chuyện khác, chị hoàn toàn đồng ý với em thế. Chỉ có điều, theo Thứ trưởng Bộ GD thì như thế có nghĩa là tờ báo của ngành rất hữu ích thì phải? Chẳng biết diễn giải thế có đúng không nhỉ?

    PA

    Trả lờiXóa
  3. Vâng, web được truy cập nhiều là một trong các tiêu chí để tăng rank. Nếu em không nhầm thì có 10 tiêu chí.
    Web được cập nhật bài vở thường xuyên cũng là một tiêu chí quan trọng để được tăng rank.
    Thu hút được số đông cũng có cái hay vì từ đó người ta có thể huy động được sức mạnh quần chúng.
    Song, có sức mạnh quần chúng để làm gì mới là quan trọng và quần chúng đó là quần chúng như thế nào cũng là chuyện đáng bàn.
    Cám ơn chị!
    HQ

    Trả lờiXóa
  4. Hi Quang,

    Chị vẫn thắc mắc về sự chính xác của con số mà báo cáo của Thứ trưởng đưa ra, vì:

    1. lượng truy cập là một trong những yếu tố tác động lên rank, nhưng báo giáo dục thời đại thì có lượng truy cập cao ngất ngưởng so với 2 blog "đối chứng" nhưng rank lại thấp hơn?

    2. nếu tính thêm các yếu tố khác, ví dụ như cập nhật bài vở thường xuyên: cái này thì chắc chắn báo giáo dục thời đại phải cập nhật hơn 2 cái blog kia là đã hẳn rồi, bài vở nhiều thế, báo mà! thế mà rank vẫn thấp?

    Kết luận: con số đó chưa chính xác (?) - mặc dù, tất nhiên nếu con số đó có cao thực thì cũng chẳng để làm gì, Quang nhỉ?

    Trả lờiXóa
  5. "Nước nhà" vẫn hay "nhầm nhọt" mà chị :)

    Trả lờiXóa
  6. Hi all,

    Tôi nhặt được comment này về entry "Số thống kê, trời ơi!" của tôi trên blog của BS Hồ Hải, vì có liên quan đến vấn đề đang thảo luận nên đưa về đây lưu để ... "cho nó khỏi lạc đàn" :-).
    ---
    Nặc danh viết:

    Theo dấu của chị Phuơng Anh tôi biết thêm đuợc 1 trang blog mới. Xin cám ơn chị.

    Anh Vũ nói đúng vì ranging từ 2.5 triệu cho đén 4 triệu gì đó là không chính xác để làm thống kê (trong statistic nguời ta dùng "Mean hay Median" chứ không ai dùng "Range". Đúng là mơ hồ và nói cho qua.

    Bàn về số liệu thống kê thì tôi cũng may là đã sở hữu đuợc một số không nhỏ về các dữ liệu của Tổng cục Thông kê xuất bản từ năm 1997.. Đủ các lọai thống kê từ mức sông dân cư, lao động việc làm, kinh tế xã hội, giáo dục (cái này thì của bộ giáo dục). Tôi phải đạt hàng và chờ đợi mài mới có đuợc vì theo như nhân viên của nhà xuất bàn ở Sàigòn vào cái năm 2003 họ nói là chẳng có ai mua cả, và tôi là nguời đầu tiên đăt mua thống kê, mà mua những gần 5 triệu bạc vào năm 2003 đấy.

    Vật vã đọc và đối chiếu thì "ối giời ơi", số liệu từ thống kê này qua thống kê khác chửi nhau chan chát.

    Đúng ra những quyền sách thống kê này phải đặt tựa là "Thống kê chuyện cuời cơ quan mới đúng"
    ---
    Đúng là truyện cười thật! Xin cám ơn Nặc danh!

    Trả lờiXóa
  7. Hà hà. Bà Chị viết bài này hơi bị độc. Trí tuệ quá! Thằng em chỉ giỏi viết nhảm, không có "evidence based" công phu cỡ này. Xin cảm ơn và tỏ lời bái phục!

    Về cái vụ thống kê theo range mà lờ tịt trung bình, trung vị..., có một biến thể so sánh về GDP của dân ta thế này: Nhà nọ ăn mỗi ngày một con gà. Tính ra là có thu nhập cao. Nhưng ông bố xơi hết thịt gà, còn chút xương xẩu cho vợ con gặm. Nhưng chung qui, nhà ta vẫn xơi một con gà mỗi ngày.
    Lương giáo viên chẳng cũng giông giống vụ thịt gà :-). Em dốt thống kê lắm, chỉ còm nhảm thế thôi.

    Trả lờiXóa
  8. Dr "nhảm" thì rõ rồi, chẳng trách rank (1,079,449), cao hơn cả rank (mất tiền) của web tôi :)

    Ở Đức có câu chuyện vui:
    - Hai chàng thống kê đi săn, hai con hươu chạy qua, một anh giương súng bóp cò, viên đạn lọt vào giữa hai con hươu, cả hai con chạy thoát, anh chàng còn lại vỗ tay hô "trúng rồi".
    Đó là kiểu đi săn của thống kê.
    Chẳng nói gì "Ta", Tây nó cũng vậy nhưng tất nhiên không "tệ" như "Ta".

    Sính ngoại!

    Trả lờiXóa
  9. Dr Nikonian,

    Trời, được 'cao thủ' blogging như Dr khen, thật nở mũi quá! Sướng quá, và ... mắc cỡ quá, không biết nói gì nữa, words fail me now, really. ;-)

    HQ,
    Chị tò mò về cái vụ trả tiền đẩy rank mà em nhắc đến quá! Em có thể cho chị thêm thông tin không?

    Mà, cũng chán thật đấy: cứ hễ vừa tìm ra một cách đo lường khách quan nào đó để đánh giá (gián tiếp) một cái gì đó, thì ngay lập tức sẽ có cách đối phó với cách đo lường đó, và cuối cùng cái số đo ấy chẳng còn ý nghĩa gì nữa cả!

    Giống như nhịp tim, là một số đo khách quan về sức khỏe, nhưng người ta có thể uống cafe, uống thuốc gì đấy, để làm tăng nhanh nhịp tim lên, thế là mất ý nghĩa của số đo, Dr nhỉ?

    (Nói thêm, Ông Tư này không phải nghề y, nói tầm bậy thì Dr sửa lưng giúp nghen?)

    Trả lờiXóa
  10. Khác với blog, trang web của em mang tính kinh doanh nên phải quảng cáo (giống như chị muốn treo biển quảng cáo ở ngã tư, chỗ đông người, siêu thị thì sẽ đắt tiền hơn ở làng quê).
    Khi khách hàng muốn mua piano, họ gõ vào google chữ piano, mua piano, bán piano, secondhandpiano...đều hiện ra doanh nghiệp của em ở trang nhất.
    Ngoài thực lực doanh nghiệp, phải có người "tung hứng", khen chê...
    Doanh nhân không chỉ "hữu xạ tự nhiên hương" được, phải nói về mình cho thiên hạ biết bằng nhiều cách khác nhau thì mọi người mới biết mình hay, mình dở ra sao mà phán xét.

    Tranh cử Tổng thống Mỹ, chị thấy 2 ứng cử đua nhau nói hay về mình, về Đảng của mình, hứa hẹn với cử tri...

    Văn hóa doanh nghiệp, văn hoá Âu - Mỹ, có quan điểm là mình phải hay, nhưng mình cũng phải "tung" mình lên thì thiên hạ mới biết chứ không im ỉm, "chúng mày phải tự biết về tao"...thì nghe nó hơi kiêu ngạo.

    Túm lại, dù đám đông thế nào cũng phải kiêng dè đám đông vì đám đông đang nuôi mình và mình trân trọng họ.

    Vài dòng gửi chị!
    Em
    Quang

    Trả lờiXóa