Câu chuyện không mới
Ứng dụng công nghệ thông tin (CNTT) trong các hoạt động thống kê không phải là câu chuyện mới đối với ngành thống kê. Cách đây vài chục năm, thống kê là một trong những ngành dẫn đầu cả nước về ứng dụng CNTT trong các hoạt động nghiệp vụ, như: Sử dụng các phần mềm trong phân tích, xử lý dữ liệu hoặc cập nhật phiếu dữ liệu thu thập được từ các cuộc điều tra thống kê với các bài toán phức tạp....
Tuy nhiên, với nhu cầu và trào lưu, xu hướng phát triển của xã hội hiện đại thì ứng dụng công nghệ thông tin không chỉ dừng lại ở đó, mà cần yêu cầu cao hơn, đó là tích hợp, chia sẻ dữ liệu, là sử dụng dữ liệu lớn trong điều tra thống kê, là ứng dụng các thiết bị công nghệ thông minh trong điều tra thống kê, là sử dụng các phần mềm thông minh để phân tích và chạy dữ liệu...
Trước thực trạng đó, khi xây dựng Luật Thống kê sửa đổi năm 2015, các nhà làm Luật đã đưa ra những điểm mới căn bản trong Luật, đó là các điều khoản liên quan đến sử dụng dữ liệu hành chính cho hoạt động thống kê và ứng dụng công nghệ thông tin cho hoạt động thống kê. Quy định của luật là cơ sở pháp lý quan trọng để ngành thống kê có căn cứ triển khai xây dựng nền tảng ứng dụng công nghệ thông tin trong các hoạt động thống kê.
Đặc biệt, gần đây nhất Bộ Chính trị đã ban hành Nghị quyết 52-NQ/TW về một số chủ trương, chính sách chủ động tham gia cuộc cách mạng công nghiệp lần thứ tư. Nghị quyết này đã nhấn thêm sức mạnh và quyết tâm ứng dụng công nghệ thông tin trong mọi mặt công tác từ quản lý điều hành đến nghiệp vụ chuyên môn của ngành Thống kê nói riêng và các ngành khác trong cả nước nói chung.
Trên con đường số hóa
Ngày 10/5/2018, Thủ tướng Chính phủ đã ký Quyết định số 501/QĐ-TTg phê duyệt Đề án ứng dụng công nghệ thông tin - truyền thông trong hoạt động thống kê Nhà nước giai đoạn 2017-2025, tầm nhìn đến năm 2030. Đề án 501 đưa ra mục tiêu chung là ứng dụng mạnh CNTT-TT và các phương pháp khoa học dữ liệu để nâng cao chất lượng hoạt động thống kê Nhà nước hướng đến hệ thống thông tin thống kê quốc gia tích hợp và hiện đại trong giai đoạn 2020-2025.
Mục tiêu đến năm 2020 xây dựng hệ thống thông tin thống kê quốc gia, từng bước kết nối với hệ thống thông tin thống kê bộ, ngành, địa phương; sử dụng công nghệ thông minh (webform và thiết bị cầm tay) thay thế phiếu điều tra giấy bằng phiếu điều tra điện tử trong các cuộc điều tra thống kê, cụ thể: 80% trong Tổng điều tra dân số và nhà ở năm 2019, 75% trong điều tra nông thôn, nông nghiệp giữa kỳ năm 2020, 75% trong điều tra doanh nghiệp và hộ cá thể, 80% trong các cuộc điều tra khác...
Bên cạnh đó, tích hợp, tiếp nhận hoàn chỉnh các dữ liệu hành chính trong các lĩnh vực thuế, hải quan, kho bạc, bảo hiểm xã hội và cơ sở dữ liệu một số bộ, ngành để biên soạn các chỉ tiêu thống kê thuộc hệ thống chỉ tiêu thống kê quốc gia, bộ chỉ tiêu phát triển bền vững của Việt Nam...
Xa hơn nữa, mục tiêu của năm 2025 là hoàn thiện hệ thống thông tin thống kê nhà nước và hệ cơ sở dữ liệu thống kê quốc gia tập trung, thống nhất theo quy định của Luật Thống kê; sử dụng 85% phiếu điều tra điện tử trong Tổng điều tra kinh tế năm 2021 và 90% trong các cuộc điều tra khác; tích hợp hoàn chỉnh dữ liệu hành chính có liên quan trong các ngành, lĩnh vực...
Theo đó, một số bộ, ngành và Tổng cục Thống kê đã thực hiện chia sẻ dữ liệu hành chính trong công tác thống kê. Việc sử dụng nguồn dữ liệu hành chính từ ngành Thuế, Kho bạc Nhà nước, các cơ quan quản lý nhà nước khác như y tế, giáo dục đào tạo, văn hóa thể thao, thông tin truyền thông trong Tổng điều tra kinh tế 2017 là một ví dụ điển hình. Đặc biệt, sự chia sẻ dữ liệu của ngành thuế trong rà soát điều tra khối doanh nghiệp đã đóng góp rất lớn vào thành công của cuộc tổng điều tra này.
Trong vài năm trở lại đây, các đơn vị nghiệp vụ thuộc Tổng cục và một số Cục Thống kê địa phương đã đẩy mạnh nghiên cứu, thử nghiệm ứng dụng một số phương thức mới trong thu thập thông tin như: Sử dụng thiết bị điện tử thông minh (CAPI) trong điều tra giá tiêu dùng, lao động - việc làm, điều tra bằng webform trong điều tra doanh nghiệp; ứng dụng phần mềm blockchaine điều tra chăn nuôi; ứng dụng phần mềm điều tra chỉ số giá tiêu dùng, chỉ số giá bất động sản bằng dữ liệu lớn hay ứng dụng bài giảng điện tử trong công tác tập huấn điều tra mức sống dân cư…
Đặc biệt, việc áp dụng hình thức thu thập thông tin bằng CAPI trong các cuộc điều tra mẫu vài năm gần đây và mới nhất là trong Tổng điều tra dân số và nhà ở 2019 cho thấy việc sử dụng thiết bị điện tử di động như máy tính bảng, điện thoại thông minh để thu thập thông tin sẽ làm tăng chất lượng dữ liệu do kiểm soát được các lỗi lô gic trong quá trình thu thập thông tin (khi điều tra viên tiến hành phỏng vấn tại hộ, phầm mềm trong thiết bị sẽ phát hiện những lỗi sai lô gic trong quá trình hộ trả lời phỏng vấn và có cảnh báo để điều tra viên kiểm tra lại thông tin kỹ hơn), giám sát được việc điều tra viên thống kê có thực tế đến hộ phỏng vấn hay không; bên cạnh đó tiết kiệm được thời gian hoàn thành phiếu điều tra (điều tra viên kết thúc phỏng vấn tại hộ, phiếu điều tra được gửi thẳng về trung tâm), nhờ đó rút ngắn thời gian xử lý và công bố dữ liệu (do không phải làm sạch phiếu và nhập tin).
Phương pháp này sẽ tiết kiệm một khoản kinh phí lớn để in phiếu giấy, thuê người nhập tin và các chi phí liên quan khác. Đã có trên 99,9% hộ dân cư được điều tra bằng hình thức CAPI trong Tổng điều tra dân số và nhà ở 2019, vượt mục tiêu Đề án 501 đề ra.
Tiếp nối thành công từ Tổng điều tra dân số và nhà ở năm 2019, điều tra thu thập thông tin về thực trạng kinh tế - xã hội của 53 dân tộc thiểu số năm 2019 cũng ứng dụng CNTT trong tất cả các khâu điều tra. Và điểm đặc biệt hơn trong cuộc điều tra này là việc kết nối các thông tin sẵn có của Tổng điều tra dân số và nhà ở năm 2019. Có khoảng hơn 20 trường dữ liệu từ kết quả của Tổng điều tra dân số và nhà ở năm 2019 được kết nối với chương trình điều tra thu thập thông tin về thực trạng kinh tế - xã hội của 53 dân tộc thiểu số năm 2019.
Các thông tin này được kiểm tra, đối chiếu trong quá trình thu thập thông tin tại địa bàn của điều tra thu thập thông tin về thực trạng kinh tế - xã hội của 53 dân tộc thiểu số năm 2019 và được sử dụng để tổng hợp số liệu và phân tích báo cáo kết quả điều tra. Đây là lần đầu tiên ngành thống kê thực hiện kết nối chuỗi dữ liệu mảng (panel data) ngay trong quá trình thu thập thông tin tại địa bàn giúp thuận tiện cho quá trình điều tra, nâng cao chất lượng thông tin, giảm bớt thời gian để thu thập các thông tin đã sẵn có.
Có thể thấy, áp dụng hình thức thu thập thông tin bằng CAPI và Webform là một bước tiến trong cải tiến phương pháp điều tra thống kê, giúp nâng cao chất lượng số liệu, giảm thời gian xử lý và công bố kết quả và phù hợp với xu hướng phát triển chung của thống kê trên thế giới và trong khu vực.
Việc sử dụng dữ liệu lớn trong điều tra thông tin cũng được một số đơn vị của ngành Thống kê nghiên cứu, thử nghiệm. Gần đây, Vụ Thống kê Giá thử nghiệm điều tra chỉ số giá bất động sản; ứng dụng công cụ lắng nghe dư luận theo hướng tiếp cận từ dữ liệu lớn hay Viện Khoa học Thống kê đã bước đầu thử nghiệm tính chỉ số giá tiêu dùng cũng qua sử dụng dữ liệu lớn của các trang web bán hàng trực tuyến có uy tín. Dù việc sử dụng dữ liệu lớn để thu thập thông tin cũng bộc lộ một số bất cập như chỉ số giá tiêu dùng tính từ nguồn big data không tính được theo vùng địa lý kinh tế, địa phương, khu vực thành thị, nông thôn và cũng không tính được cho tất cả các ngành hàng… Tuy nhiên, kết quả thu được từ những nghiên cứu này cũng là gợi ý rất đáng lưu tâm trong quá trình hoàn thiện công tác thống kê trong thời đại công nghệ thông tin hiện nay.
Rõ ràng, việc ứng dụng công nghệ thông tin vào hoạt động thống kê đã đem lại những lợi ích to lớn, tuy nhiên để việc ứng dụng này đạt hiệu quả to lớn rất cần sự đầu tư cơ bản từ hạ tầng thông tin, hạ tầng kỹ thuật, đào tạo nhân lực và trên hết là ý thức của đội ngũ lãnh đạo các cấp từ trung ương đến địa phương quyết tâm đưa số hóa, công nghệ hóa vào thực tiễn công tác từ quản lý điều hành đến chuyên môn nghiệp vụ nhằm hướng tới nâng cao chất lượng số liệu thống kê trong thời đại kỷ nguyên số./.