paint-brush
Sơ lược về lịch sử tính toán và phân tích dữ liệu - Từ thẻ đục lỗ đến "Ngăn xếp dữ liệu hiện đại"từ tác giả@benscholtz
264 lượt đọc

Sơ lược về lịch sử tính toán và phân tích dữ liệu - Từ thẻ đục lỗ đến "Ngăn xếp dữ liệu hiện đại"

từ tác giả Benjamin Scholtz3m2024/02/01
Read on Terminal Reader

dài quá đọc không nổi

Một hành trình từ nguồn gốc của điện toán và phân tích dữ liệu đến cái mà ngày nay chúng ta gọi là "Ngăn xếp dữ liệu hiện đại". Tiếp theo là gì?
featured image - Sơ lược về lịch sử tính toán và phân tích dữ liệu - Từ thẻ đục lỗ đến "Ngăn xếp dữ liệu hiện đại"
Benjamin Scholtz HackerNoon profile picture


Một hành trình từ nguồn gốc của điện toán và phân tích dữ liệu đến cái mà ngày nay chúng ta gọi là "Ngăn xếp dữ liệu hiện đại". Tiếp theo là gì?

Nguồn gốc của máy tính và phân tích dữ liệu

Nguồn gốc của điện toán và phân tích dữ liệu bắt đầu vào giữa những năm 1950 và bắt đầu hình thành với sự ra đời của SQL vào năm 1970:



Tập tin này có nguồn gốc từ Wikimedia và được cấp phép theo giấy phép Creative Commons Ghi công 2.0 Chung.

Tập tin này có nguồn gốc từ Wikimedia và được cấp phép theo giấy phép Creative Commons Ghi công 2.0 Chung.



  • 1960: Thẻ đục lỗ


Tập tin này có nguồn gốc từ Wikimedia và được cấp phép theo giấy phép Creative Commons Ghi công 2.0 Chung.



  • 1970: Ngôn ngữ truy vấn có cấu trúc (SQL)
  • Thập niên 1970: Hệ thống hoạch định tài chính tương tác - Tạo ra ngôn ngữ “cho phép các nhà điều hành xây dựng mô hình mà không cần qua trung gian”
  • 1972: C, LUNAR - Một trong những ứng dụng sớm nhất của máy tính hiện đại, hệ thống truy xuất thông tin ngôn ngữ tự nhiên, giúp các nhà địa chất truy cập, so sánh và đánh giá dữ liệu phân tích hóa học về thành phần đất và đá trên mặt trăng
  • 1975: Express - Hệ thống xử lý phân tích trực tuyến (OLAP) đầu tiên, nhằm phân tích dữ liệu kinh doanh từ các quan điểm khác nhau
  • 1979: VisiCalc - Chương trình máy tính bảng tính đầu tiên



Tập tin này có nguồn gốc từ Wikimedia và được cấp phép theo giấy phép Creative Commons Ghi công 2.0 Chung.


  • Những năm 1980: Hệ thống hỗ trợ ra quyết định nhóm - “Hệ thống làm việc hợp tác trên máy tính”


“Ngăn xếp dữ liệu hiện đại”

"Ngăn xếp dữ liệu hiện đại" là một tập hợp các công nghệ và công cụ được sử dụng để thu thập, lưu trữ, xử lý, phân tích và trực quan hóa dữ liệu trong nền tảng dựa trên đám mây được tích hợp tốt. Mặc dù QlikView đã có trước đám mây nhưng đây là ví dụ sớm nhất về thứ mà hầu hết mọi người đều nhận ra là bảng điều khiển phân tích được sử dụng bởi các nền tảng hiện đại như Tableau và PowerBI:


  • 1994: QlikView - “Phân tích dựa trên bảng điều khiển”


Tập tin này có nguồn gốc từ Wikimedia và được cấp phép theo giấy phép Creative Commons Ghi công 2.0 Chung.


  • 2003: Hoạt cảnh
  • 2009: Wolfram Alpha - “Công cụ tìm kiếm tính toán”
  • 2015: PowerBI
  • 2017: ThoughtSpot - “Phân tích dựa trên tìm kiếm”

Giấy, Ngôn ngữ truy vấn, Bảng tính, Bảng điều khiển, Tìm kiếm, tiếp theo là gì?

Một số ứng dụng phân tích sáng tạo nhất, ít nhất là về mặt trải nghiệm người dùng, chuyển đổi ngôn ngữ của con người sang một số đầu ra tính toán:


  • Chuyển văn bản sang SQL: Một câu chuyện đã có từ lâu đời, LUNAR được phát triển lần đầu tiên vào những năm 70 để giúp các nhà địa chất truy cập, so sánh và đánh giá dữ liệu phân tích hóa học bằng ngôn ngữ tự nhiên. Salesforce WikiSQL đã giới thiệu bản tóm tắt dữ liệu mở rộng đầu tiên được xây dựng cho trường hợp sử dụng chuyển văn bản sang SQL nhưng chỉ chứa các truy vấn SQL đơn giản. Bộ dữ liệu Yale Spider đã giới thiệu điểm chuẩn cho các truy vấn phức tạp hơn và gần đây nhất, BIRD đã giới thiệu các truy vấn “bẩn” trong thế giới thực và điểm hiệu quả để tạo điểm chuẩn phù hợp cho các ứng dụng chuyển văn bản sang SQL.
  • Ngôn ngữ chuyển văn bản sang tính toán: Wolfram Alpha, ThoughtSpot
  • Chuyển văn bản thành mã: Phân tích dữ liệu nâng cao ChatGPT


"Phân tích dữ liệu theo hướng hội thoại" có phải là sự phát triển tự nhiên không?


  • Trải nghiệm người dùng của các giao diện phân tích hiện đại như tìm kiếm và trò chuyện đang phát triển , trở nên trực quan hơn, được hỗ trợ bởi NLP và LLM
  • Giao diện phân tích có nguồn gốc từ việc hỗ trợ người ra quyết định, nhưng người ra quyết định vẫn chủ yếu phụ thuộc vào các nhà phân tích dữ liệu
  • Nhiều truy vấn của người ra quyết định mang tính đặc biệt , phù hợp nhất với “phân tích dùng một lần”
  • Tạo thông tin chi tiết là một quá trình sáng tạo trong đó thu được nhiều hiểu biết sâu sắc trong các cuộc trò chuyện về dữ liệu, có thể với các đồng nghiệp
  • Quy trình phân tích dữ liệu rời rạc , từ hình dung phân tích đến trình bày kết quả

Sự nhìn nhận

Ngày dành cho phần "Nguồn gốc của máy tính và phân tích dữ liệu" nhờ https://web.paristech.com/hs-fs/file-2487731396.pdfhttp://dssresources.com/history/dsshistoryv28.html .


Cũng được xuất bản ở đây.