Cách trích xuất văn bản hoặc hình ảnh từ tệp PDF

Cách trích xuất văn bản hoặc hình ảnh từ tệp PDF
Cách trích xuất văn bản hoặc hình ảnh từ tệp PDF
Anonim

Tệp PDF rất tuyệt vời để trao đổi các tệp được định dạng giữa các nền tảng và giữa những người không sử dụng cùng một phần mềm, nhưng đôi khi chúng ta cần lấy văn bản hoặc hình ảnh ra khỏi tệp PDF và sử dụng chúng trong các trang web, xử lý văn bản tài liệu, bản trình bày PowerPoint hoặc trong phần mềm xuất bản trên máy tính để bàn.

Tùy thuộc vào nhu cầu của bạn và các tùy chọn bảo mật được đặt trong từng tệp PDF, bạn có một số tùy chọn để trích xuất văn bản, hình ảnh hoặc cả hai từ tệp PDF. Chọn tùy chọn phù hợp nhất với bạn.

Image
Image
  • Sử dụng Adobe Acrobat Professional Nếu bạn có phiên bản đầy đủ của Adobe Acrobat, không chỉ là Acrobat Reader miễn phí, bạn có thể trích xuất từng hình ảnh hoặc tất cả hình ảnh cũng như văn bản từ PDF và xuất ở nhiều định dạng khác nhau như EPS,-j.webp" />Tools> Export PDFvà chọn một tùy chọn. Để trích xuất văn bản, hãy xuất PDF sang định dạng Word hoặc định dạng văn bản đa dạng thức và chọn từ một số tùy chọn nâng cao bao gồm:

    • Giữ lại dòng chữ
    • Giữ lại Bố cục Trang
    • Bao gồm Nhận xét
    • Bao gồm Hình ảnh
    Image
    Image
  • Sao chép và dán từ PDF bằng Acrobat ReaderNếu bạn có Acrobat Reader, bạn có thể sao chép một phần của tệp PDF vào khay nhớ tạm và dán vào chương trình khác. Đối với văn bản, chỉ cần đánh dấu phần văn bản trong PDF và nhấn Ctrl+ Cđể sao chép.

    Sau đó, mở chương trình xử lý văn bản, chẳng hạn như Microsoft Word, và nhấn Ctrl+ Vđể dán văn bản. Với một hình ảnh, hãy nhấp vào hình ảnh đó để chọn, sau đó sao chép và dán nó vào một chương trình hỗ trợ hình ảnh, sử dụng các lệnh bàn phím tương tự.

  • Mở tệp PDF trong chương trình đồ họa. Khi mục tiêu của bạn là trích xuất hình ảnh, bạn có thể mở tệp PDF trong một số chương trình minh họa như phiên bản mới hơn của Photoshop, CorelDRAW hoặc Adobe Illustrator và lưu hình ảnh để chỉnh sửa và sử dụng trong các ứng dụng xuất bản trên máy tính để bàn.

    Image
    Image
  • Sử dụng các công cụ phần mềm trích xuất PDF của bên thứ baCó sẵn một số tiện ích và trình cắm độc lập giúp chuyển đổi tệp PDF sang HTML trong khi vẫn giữ nguyên bố cục trang, trích xuất và chuyển đổi nội dung PDF sang định dạng đồ họa vector và trích xuất nội dung PDF để sử dụng trong phần mềm xử lý văn bản, trình bày và xuất bản trên máy tính để bàn. Các công cụ này cung cấp các tùy chọn khác nhau bao gồm trích xuất / chuyển đổi hàng loạt, trích xuất toàn bộ tệp hoặc một phần nội dung và hỗ trợ nhiều định dạng tệp. Đây chủ yếu là các tiện ích thương mại và phần mềm chia sẻ dựa trên Windows.

  • Sử dụng các công cụ trích xuất PDF trực tuyếnVới các công cụ trích xuất trực tuyến, bạn không cần phải tải xuống hoặc cài đặt phần mềm. Mỗi loại có thể chiết xuất bao nhiêu khác nhau. Ví dụ: với ExtractPDF.com, bạn tải lên tệp có kích thước tối đa 14MB hoặc cung cấp URL cho PDF để trích xuất hình ảnh, văn bản hoặc phông chữ.

    Image
    Image
  • Chụp ảnh màn hìnhTrước khi bạn chụp ảnh màn hình của một hình ảnh trong PDF, hãy phóng to nó trong cửa sổ của nó nhiều nhất có thể trên màn hình của bạn. Trên PC, chọn thanh tiêu đề của cửa sổ PDF và nhấn Alt+ PrtScnTrên máy Mac, nhấn Command +Shift +4 và sử dụng con trỏ xuất hiện để kéo và chọn khu vực bạn muốn chụp.

Đề xuất: