Cách AI Giúp Giải Mã Các Chữ Khắc Cổ

Mục lục:

Cách AI Giúp Giải Mã Các Chữ Khắc Cổ
Cách AI Giúp Giải Mã Các Chữ Khắc Cổ
Anonim

Bài học rút ra chính

  • Một công cụ mới do AI hỗ trợ có thể giúp các nhà sử học giải mã các văn bản cổ.
  • Ithaca là mạng nơ-ron sâu đầu tiên có thể khôi phục văn bản bị thiếu của các chữ khắc bị hỏng, xác định vị trí ban đầu của chúng và giúp xác định ngày chúng được tạo ra.
  • AI rất hữu ích để điền vào các dữ liệu bị thiếu như vị trí và ngày của văn bản vì nó có khả năng học tốt các mẫu rất phức tạp bằng cách phân tích dữ liệu.
Image
Image

Những tiến bộ gần đây trong trí tuệ nhân tạo (AI) đang tiếp thêm sức mạnh cho những nỗ lực để hiểu quá khứ.

Ithaca, một mô hình học máy do các nhà nghiên cứu AI tại DeepMind xây dựng, có thể đoán các từ còn thiếu cũng như vị trí và ngày tháng của ngôn ngữ viết, theo một bài báo mới. Nỗ lực này có thể giúp các nhà sử học giải mã các bản thảo cổ.

“Ithaca là một mạng lưới thần kinh sâu và như vậy, nó có khả năng cực kỳ cao trong việc tìm ra các mẫu ẩn trong một lượng lớn dữ liệu, '' nhà sử học Thea Sommerschield, đồng tác giả của bài báo gần đây, nói với Lifewire trong một email phỏng vấn. “Các mẫu như vậy có thể là văn bản (ngữ pháp, cú pháp hoặc được liên kết với một 'công thức' lặp lại trên nhiều văn bản) hoặc theo ngữ cảnh (một số từ nhất định xuất hiện nhất quán trong các thể loại văn bản nhất định: ví dụ: một sắc lệnh chính trị từ Athens Cổ điển đề cập đến các từ 'liên minh, hội đồng, hội đồng… ').”

Tiết lộ quá khứ

Ithaca là mạng nơ-ron sâu đầu tiên có thể khôi phục văn bản còn thiếu của các chữ khắc bị hỏng, xác định vị trí ban đầu của chúng và giúp xác định ngày chúng được tạo ra, Sommerschield nói.

Ithaca được đặt theo tên của hòn đảo Hy Lạp trong Homer’s Odyssey. Các nhà nghiên cứu phát hiện ra rằng Ithaca đạt được độ chính xác 62% trong việc khôi phục các văn bản bị hư hỏng, độ chính xác 71% trong việc xác định vị trí ban đầu của chúng và có thể xác định niên đại các văn bản trong vòng 30 năm kể từ ngày xuất xứ của chúng.

Công cụ hỗ trợ trực quan của Ithaca nhằm giúp các nhà nghiên cứu diễn giải kết quả dễ dàng hơn. Các tác giả của bài báo viết rằng các nhà sử học đạt được độ chính xác 25% khi làm việc một mình để khôi phục các văn bản cổ. Tuy nhiên, hiệu suất của nhà sử học tăng lên 72% khi sử dụng Ithaca, vượt qua hiệu suất của mô hình và cho thấy tiềm năng hợp tác giữa người và máy.

“Ithaca cung cấp kết quả đầu ra có thể hiểu được, cho thấy tầm quan trọng ngày càng tăng của sự hợp tác giữa các chuyên gia con người và máy học, đồng thời cho thấy việc kết hợp các chuyên gia con người với kiến trúc học sâu để giải quyết các công việc một cách hợp tác có thể vượt qua hiệu suất cá nhân (không có sự trợ giúp) của cả con người và Sommerschield nói với Lifewire.

Ví dụ: các nhà sử học hiện không đồng ý về ngày của một loạt các sắc lệnh quan trọng của người Athen được đưa ra vào thời điểm mà các nhân vật nổi tiếng như Socrates và Pericles còn sống, Sommerschield viết trong một bài đăng trên blog. Các sắc lệnh từ lâu được cho là đã được viết trước năm 446/445 trước Công nguyên, mặc dù bằng chứng mới cho thấy niên đại của những năm 420 trước Công nguyên. “Mặc dù nó có vẻ như là một sự khác biệt nhỏ, nhưng những sắc lệnh này là nền tảng cho sự hiểu biết của chúng ta về lịch sử chính trị của Athens Cổ điển,” cô viết

Công việc gần nhất với Ithaca là một công cụ học máy trước đây có tên là Pythia mà Sommerschield và các cộng tác viên của cô đã phát hành vào năm 2019. Pythia là mô hình khôi phục văn bản cổ đại đầu tiên sử dụng mạng nơ ron sâu.

“Hôm nay, Ithaca là mô hình đầu tiên giải quyết ba nhiệm vụ trọng tâm trong quy trình làm việc của người lập trình một cách tổng thể,” Sommerschield cho biết trong một email. “Nó không chỉ nâng cao bộ kỹ thuật hiện đại trước đây của Pythia, mà còn sử dụng học sâu để phân bổ địa lý và thời gian lần đầu tiên và trên quy mô chưa từng có.”

AI để hỗ trợ các nhà sử học

Image
Image

AI rất hữu ích để điền vào các dữ liệu còn thiếu như vị trí và ngày của văn bản vì nó rất giỏi trong việc học các mẫu rất phức tạp bằng cách phân tích dữ liệu, Brad Quinton, Giám đốc điều hành của công ty AI Singulos Research, nói với Lifewire qua email.

“Sử dụng các kỹ thuật học máy, AI có thể xem qua một số lượng lớn các ví dụ“hay đã biết”để tìm ra các mẫu giữa một văn bản nhất định với ngày tháng và vị trí tạo của nó,” Quinton nói thêm. “Thông thường, những mẫu này phức tạp đến mức chúng sẽ không rõ ràng đối với một chuyên gia về con người.”

Dự đoán dữ liệu bị thiếu là nhiệm vụ phổ biến của AI dựa trên máy học. Ví dụ: GPT-3 của OpenAI có thể dự đoán các từ bị thiếu trong một câu hoặc thậm chí các câu bị thiếu trong một đoạn văn. Và nhiều hệ thống xử lý hình ảnh dựa trên AI đã được sử dụng để khôi phục video và hình ảnh bằng cách dự đoán thông minh những gì đã bị mất so với ban đầu.

“Về mặt khái niệm, các nhà nghiên cứu có thể sử dụng các kỹ thuật tương tự để xác định niên đại và nguồn gốc của nghệ thuật hoặc công cụ, hoặc các đồ tạo tác lịch sử khác do con người tạo ra trong đó có kỳ vọng về sự thay đổi trong phong cách và kỹ thuật cơ bản theo thời gian và theo vị trí của nguồn gốc,”Quinton nói.

Đề xuất: