Share workflow n8n Miễn Phí - Crawl bài viết của các trang web sau đó tóm tắt và xử lý ngôn ngữ tự nhiên bằng AI

Dương Tiến
371

Workflow n8n: Tự động hóa tóm tắt bài viết của Website và AI

Quy trình làm việc n8n này là một giải pháp tự động hóa toàn diện, giúp bạn dễ dàng thu thập và tóm tắt những bài viết mới nhất trực tiếp từ trang web. Sử dụng sức mạnh của AI (GPT-4o), nó biến đổi các tác vụ phức tạp thành một luồng công việc liền mạch, từ quét web đến xử lý ngôn ngữ tự nhiên (NLP).

anh mơi.jpg

 

Giải pháp n8n automation template này tích hợp các bước quan trọng như:

- Quét web và Yêu cầu HTTP: Tự động truy cập và lấy dữ liệu từ trang web.
- Trích xuất nội dung HTML: Phân tích và chọn lọc chính xác các phần nội dung cần thiết.
- Tóm tắt xử lý ngôn ngữ tự nhiên (NLP): Sử dụng GPT-4o để tóm tắt nội dung bài luận một cách thông minh và hiệu quả.
Với quy trình này, bạn có thể nhanh chóng nắm bắt ý chính các bài viết mới của các trang web mà không cần đọc toàn bộ, tiết kiệm thời gian và tối ưu hóa việc tiếp cận thông tin.

Để Setup template n8n miễn phí này của datadex Các bạn triển khai các bước sau:

Bước 1: Khởi tạo quy trình làm việc mới

Mở n8n và tạo một quy trình làm việc mới. Đảm bảo bạn đang sử dụng phiên bản n8n 1.50.0 trở lên để có đầy đủ các tính năng cần thiết.

Bước 2: Thêm nút kích hoạt (Trigger Node)

Thêm một nút Manual Trigger. Đặt tên cho nó là "When clicking "Execute Workflow"". Nút này sẽ cho phép bạn chạy quy trình làm việc thủ công khi cần.

Bước 3: Thu thập danh sách bài luận

Thêm một nút HTTP Request với tên "Fetch Essay List".Method: GET
URL: domain/articles.html
Kết nối đầu ra của nút kích hoạt thủ công với nút này.

Bước 4: Trích xuất tên bài luận

Thêm một nút HTML Extract có tên "Extract essay names".Operation: Extract HTML Content
Extract Value:Key: essay
CSS Selector: table table a
Attribute: href
Return Array: True
Kết nối đầu ra của nút "Fetch Essay List" với nút này.

Bước 5: Chia nhỏ dữ liệu

Thêm một nút SplitOut có tên "Split out into items".Field to Split: essay
Kết nối đầu ra của nút "Extract essay names" với nút này.

Bước 6: Giới hạn số lượng bài luận

Thêm một nút Limit có tên "Limit to first 3".Max Items: 3
Kết nối đầu ra của nút "Split out into items" với nút này.

Bước 7: Lấy nội dung bài luận

Thêm một nút HTTP Request có tên "Fetch essay texts".Method: GET
URL: Chọn chế độ Expression và nhập: =domain/{{ $json.essay }}
Kết nối đầu ra của nút "Limit to first 3" với nút này.
Bước 8: Trích xuất tiêu đề và văn bản

Thêm hai nút HTML Extract song song, cả hai đều kết nối với nút "Fetch essay texts":

Nút 1: "Extract title"

Operation: Extract HTML Content
Extract Value:Key: title
CSS Selector: title
Nút 2: "Extract Text Only"

Operation: Extract HTML Content
Extract Value:Key: data
CSS Selector: body
Ignore Selector: img,nav

Bước 9: Chia văn bản thành các khối

Thêm một nút Langchain Recursive Character Text Splitter có tên "Recursive Character Text Splitter".Chunk Size: 6000
Kết nối đầu ra của nút "Extract Text Only" vào đầu vào ai_textSplitter của nút này.

Bước 10: Tải dữ liệu tài liệu

Thêm một nút Langchain Default Data Loader có tên "Default Data Loader".JSON Data: Chọn chế độ Expression và nhập: ={{ $('Extract Text Only').item.json.data }}
JSON Mode: Expression Data
Kết nối đầu ra của nút "Recursive Character Text Splitter" vào đầu vào ai_textSplitter của nút này.

Bước 11: Thiết lập mô hình AI

Thêm một nút Langchain OpenAI Chat Model có tên "OpenAI Chat Model".Model: Chọn gpt-4o-mini
Credentials: Cấu hình thông tin xác thực OpenAI API của bạn (OAuth hoặc khóa API).
Không cần kết nối đầu vào cho nút này.

Bước 12: Tóm tắt nội dung với AI

Thêm một nút Langchain Summarization Chain có tên "Summarization Chain".Operation Mode: documentLoader
Kết nối nút "Default Data Loader" vào đầu vào ai_document của nút này.
Kết nối nút "OpenAI Chat Model" vào đầu vào ai_languageModel của nút này.
(Nếu chưa tự động) Kết nối đầu ra của nút "Extract Text Only" với nút "Recursive Character Text Splitter".
Kết nối đầu ra của nút "Summarization Chain" với nút tiếp theo (Merge).

Bước 13: Hợp nhất dữ liệu

Thêm một nút Merge có tên "Merge".Mode: Combine
Merge By: Position
Kết nối đầu ra của nút "Extract title" vào đầu vào đầu tiên.
Kết nối đầu ra của nút "Summarization Chain" vào đầu vào thứ hai.

Bước 14: Dọn dẹp và sắp xếp dữ liệu

Thêm một nút Set có tên "Clean up".Assignments:title (string): ={{ $json.title }}
summary (string): ={{ $json.response.text }}
url (string): =domain/{{ $('Limit to first 3').first().json.essay }}
Kết nối đầu ra của nút "Merge" với nút này.

Bước 15: Ghi chú (Tùy chọn)

Bạn có thể tùy chọn thêm các nút Sticky Note với các bình luận liên quan để làm rõ quy trình làm việc của mình. Điều này giúp bạn và những người khác dễ hiểu hơn khi xem lại n8n automation template này.

Chúc mừng! Bạn đã hoàn thành việc xây dựng một quy trình làm việc tự động hóa mạnh mẽ trong n8n. Quy trình này không chỉ giúp bạn thu thập và tóm tắt thông tin hiệu quả mà còn là một n8n automation template tuyệt vời để bạn tham khảo và tùy biến cho các dự án tương lai.

Hãy thử nghiệm quy trình này và xem n8n có thể giúp bạn tự động hóa những tác vụ nào khác! Nếu bạn có bất kỳ câu hỏi nào về việc tạo n8n automation template hoặc cần hỗ trợ, đừng ngần ngại để lại bình luận bên dưới nhé!

Tải workflow tại đây

Trang chủ Fanpage Messenger

Giới thiệu

Kết nối với chúng tôi