Nghiên cứu Rộng: Vượt ra ngoài Cửa sổ Ngữ cảnh
Thứ Năm, tháng 10 30
Sản phẩm
Lời hứa của nghiên cứu dựa trên AI luôn rất hấp dẫn: giao phó công việc tẻ nhạt của việc thu thập và tổng hợp thông tin cho một hệ thống thông minh, giải phóng nhận thức của con người để phân tích và ra quyết định ở cấp độ cao hơn. Tuy nhiên, bất kỳ ai đã thúc đẩy các hệ thống này trong các trường hợp sử dụng không tầm thường đều đã gặp phải một thực tế đáng thất vọng: đến mục thứ tám hoặc thứ chín trong một nhiệm vụ nghiên cứu đa chủ đề, AI bắt đầu bịa đặt.
Không chỉ đơn giản hóa. Không chỉ tóm tắt ngắn gọn hơn. Bịa đặt.
Đây không phải là vấn đề kỹ thuật prompt. Không phải là vấn đề về khả năng của mô hình. Đó là một ràng buộc kiến trúc đã âm thầm hạn chế tiện ích của các công cụ nghiên cứu AI kể từ khi chúng ra đời. Và đó là ràng buộc mà Wide Research được thiết kế để vượt qua.
Cửa sổ ngữ cảnh: Một nút thắt cơ bản
Mỗi mô hình ngôn ngữ lớn đều hoạt động trong một cửa sổ ngữ cảnh, một bộ đệm bộ nhớ hữu hạn giới hạn lượng thông tin mà mô hình có thể xử lý tích cực tại bất kỳ thời điểm nào. Các mô hình hiện đại đã đẩy ranh giới này một cách ấn tượng: từ 4K token lên 32K, 128K, và thậm chí 1M token trong các phiên bản gần đây.
Tuy nhiên vấn đề vẫn tồn tại.
Khi bạn yêu cầu AI nghiên cứu nhiều thực thể - chẳng hạn như năm mươi công ty, ba mươi bài báo nghiên cứu, hoặc hai mươi sản phẩm cạnh tranh - cửa sổ ngữ cảnh nhanh chóng bị lấp đầy. Không chỉ là thông tin thô về mỗi thực thể, mà còn:
•Đặc điểm kỹ thuật nhiệm vụ ban đầu và các yêu cầu
•Mẫu cấu trúc để định dạng đầu ra nhất quán
•Lý luận và phân tích trung gian cho mỗi mục
•Tham chiếu chéo và ghi chú so sánh
•Ngữ cảnh tích lũy của tất cả các mục trước đó
Đến khi mô hình đạt đến mục thứ tám hoặc thứ chín, cửa sổ ngữ cảnh đang chịu áp lực rất lớn. Mô hình phải đối mặt với một lựa chọn bất khả thi: thất bại rõ ràng, hoặc bắt đầu cắt giảm. Nó luôn chọn cái sau.
Ngưỡng Bịa Đặt
Đây là những gì xảy ra trong thực tế:
Mục 1-5: Mô hình thực hiện nghiên cứu chân thực. Nó truy xuất thông tin, tham chiếu chéo các nguồn và tạo ra phân tích chi tiết, chính xác.
Mục 6-8: Chất lượng bắt đầu suy giảm một cách tinh vi. Các mô tả trở nên hơi chung chung hơn. Mô hình bắt đầu dựa nhiều hơn vào các mẫu trước đó thay vì nghiên cứu mới.
Mục 9+: Mô hình bước vào chế độ bịa đặt. Không thể duy trì tải nhận thức của nghiên cứu kỹ lưỡng trong khi quản lý một ngữ cảnh tràn ngập, nó bắt đầu tạo ra nội dung nghe có vẻ hợp lý dựa trên các mẫu thống kê, không phải điều tra thực tế.
Những bịa đặt này rất tinh vi. Chúng nghe có vẻ đáng tin. Chúng tuân theo định dạng đã thiết lập một cách hoàn hảo. Chúng thường không có lỗi ngữ pháp và phong cách nhất quán với các mục nhập hợp pháp trước đó.
Chúng cũng thường sai. Một phân tích đối thủ cạnh tranh có thể gán các tính năng cho các công ty không cung cấp chúng. Một bài tổng quan tài liệu có thể trích dẫn các bài báo với những phát hiện được bịa đặt. Một so sánh sản phẩm có thể tạo ra các mức giá hoặc thông số kỹ thuật không có thật.
Phần nguy hiểm là những sự bịa đặt này rất khó phát hiện mà không cần xác minh thủ công—điều này làm mất đi toàn bộ mục đích của nghiên cứu tự động.
Tại Sao Cửa Sổ Ngữ Cảnh Lớn Hơn Không Thể Khắc Phục Điều Này
Phản ứng trực quan là đơn giản mở rộng cửa sổ ngữ cảnh. Nếu 32K token không đủ, hãy sử dụng 128K. Nếu vẫn chưa đủ, hãy đẩy lên 200K hoặc hơn nữa.
Cách tiếp cận này hiểu sai vấn đề.
Thứ nhất, sự suy giảm ngữ cảnh không phải là nhị phân. Một mô hình không duy trì khả năng ghi nhớ hoàn hảo trong toàn bộ cửa sổ ngữ cảnh của nó. Các nghiên cứu đã chỉ ra rằng độ chính xác truy xuất giảm dần theo khoảng cách từ vị trí hiện tại—hiện tượng "lạc trong giữa". Thông tin ở đầu và cuối ngữ cảnh được nhớ đáng tin cậy hơn thông tin ở giữa. Thứ hai, chi phí xử lý tăng không tỷ lệ thuận. Chi phí để xử lý một ngữ cảnh 400K token không chỉ gấp đôi chi phí của 200K—nó tăng theo cấp số nhân cả về thời gian và tài nguyên tính toán. Điều này khiến việc xử lý ngữ cảnh lớn trở nên không khả thi về mặt kinh tế cho nhiều trường hợp sử dụng.
Thứ ba, vấn đề là tải nhận thức. Ngay cả với ngữ cảnh vô hạn, việc yêu cầu một mô hình duy trì chất lượng nhất quán trên hàng chục nhiệm vụ nghiên cứu độc lập tạo ra một nút thắt nhận thức. Mô hình phải liên tục chuyển đổi ngữ cảnh giữa các mục, duy trì một khuôn khổ so sánh, và đảm bảo tính nhất quán về phong cách—tất cả trong khi thực hiện nhiệm vụ nghiên cứu cốt lõi. Thứ tư, áp lực độ dài ngữ cảnh. Sự "kiên nhẫn" của mô hình, ở một mức độ nào đó, được quyết định bởi phân phối độ dài của các mẫu trong dữ liệu huấn luyện. Tuy nhiên, hỗn hợp dữ liệu sau huấn luyện của các mô hình ngôn ngữ hiện tại vẫn chủ yếu là các tương tác tương đối ngắn được thiết kế cho kiểu tương tác chatbot. Do đó, khi độ dài nội dung của tin nhắn trợ lý vượt quá một ngưỡng nhất định, mô hình tự nhiên sẽ trải qua một loại áp lực độ dài ngữ cảnh, thúc đẩy nó nhanh chóng tóm tắt hoặc sử dụng các hình thức biểu đạt không đầy đủ như các điểm đánh dấu.
Cửa sổ ngữ cảnh là một ràng buộc, đúng vậy. Nhưng đó là triệu chứng của một giới hạn kiến trúc sâu hơn: mô hình đơn xử lý, tuần tự.
Sự Thay Đổi Kiến Trúc: Xử Lý Song Song
Nghiên cứu Rộng (Wide Research)
Nghiên cứu Rộng đại diện cho một sự tái tư duy cơ bản về cách hệ thống AI nên tiếp cận các nhiệm vụ nghiên cứu quy mô lớn. Thay vì yêu cầu một bộ xử lý xử lý n mục tuần tự, chúng tôi triển khai n tác nhân phụ song song để xử lý n mục cùng một lúc.

Kiến trúc Nghiên cứu Rộng
Khi bạn khởi chạy một nhiệm vụ Nghiên cứu Rộng, hệ thống hoạt động như sau:
1. Phân tách Thông minh
Bộ điều khiển chính phân tích yêu cầu của bạn và chia nhỏ nó thành các nhiệm vụ phụ độc lập, có thể chạy song song. Điều này liên quan đến việc hiểu cấu trúc nhiệm vụ, xác định các phụ thuộc và tạo ra các đặc tả phụ mạch lạc.
2. Ủy quyền cho Tác nhân phụ
Đối với mỗi nhiệm vụ phụ, hệ thống khởi động một tác nhân phụ chuyên dụng. Quan trọng là, đây không phải là các quy trình nhẹ - chúng là các phiên bản Manus đầy đủ tính năng, mỗi phiên bản có:
•Một môi trường máy ảo hoàn chỉnh
Thực hiện song song
Tất cả các tác nhân phụ thực hiện đồng thời. Mỗi tác nhân tập trung độc quyền vào mục được giao, thực hiện cùng mức độ nghiên cứu và phân tích như khi làm nhiệm vụ đơn lẻ.
4. Điều phối tập trung
Bộ điều khiển chính duy trì sự giám sát, thu thập kết quả khi các tác nhân phụ hoàn thành công việc của họ. Quan trọng là, các tác nhân phụ không giao tiếp với nhau, tất cả sự điều phối đều thông qua bộ điều khiển chính. Điều này ngăn chặn ô nhiễm ngữ cảnh và duy trì tính độc lập.
5. Tổng hợp và tích hợp
Khi tất cả các tác nhân phụ đã báo cáo lại, bộ điều khiển chính tổng hợp các kết quả thành một báo cáo đơn lẻ, mạch lạc và toàn diện. Bước tổng hợp này tận dụng toàn bộ khả năng ngữ cảnh của bộ điều khiển chính, vì nó không bị gánh nặng với nỗ lực nghiên cứu ban đầu.
Tại sao Điều này Thay đổi Tất cả
Chất lượng Nhất quán ở Quy mô lớn
Mỗi mục đều nhận được cùng một sự đối xử. Mục thứ 50 được nghiên cứu kỹ lưỡng giống như mục đầu tiên. Không có đường cong suy giảm, không có ngưỡng bịa đặt, và không có vách đá chất lượng.
Khả năng Mở rộng Ngang Thực sự
Cần phân tích 10 mục? Hệ thống triển khai 10 tác nhân phụ. Cần phân tích 500? Nó triển khai 500. Kiến trúc mở rộng tuyến tính với kích thước của nhiệm vụ, không phải theo cấp số nhân như các phương pháp dựa trên ngữ cảnh.
Tăng tốc Đáng kể
Bởi vì các tác nhân phụ hoạt động song song, thời gian thực tế cần thiết để phân tích 50 mục xấp xỉ bằng thời gian phân tích 5 mục. Nút thắt cổ chai chuyển từ thời gian xử lý tuần tự sang thời gian tổng hợp—một thành phần nhỏ hơn nhiều trong toàn bộ nhiệm vụ.
Giảm Tỷ lệ Ảo tưởng
Tác tử phụ hoạt động trong vùng thoải mái nhận thức của mình
Mỗi tác tử phụ hoạt động trong vùng thoải mái nhận thức của mình. Với một bối cảnh mới và một nhiệm vụ tập trung duy nhất, không có áp lực phải bịa đặt. Tác tử phụ có thể thực hiện nghiên cứu chân thực, xác minh sự kiện và duy trì độ chính xác.
Tính độc lập và độ tin cậy
Bởi vì các tác tử phụ không chia sẻ bối cảnh, một lỗi hoặc ảo giác trong công việc của một tác tử phụ không lan truyền đến những tác tử khác. Mỗi phân tích đứng độc lập, giảm thiểu rủi ro hệ thống.
Vượt ra ngoài nghiên cứu: Một công cụ xử lý song song đa mục đích
Mặc dù chúng ta gọi nó là "Nghiên cứu rộng", các ứng dụng của kiến trúc này mở rộng ra ngoài các nhiệm vụ nghiên cứu truyền thống.
Xử lý tài liệu hàng loạt
Xử lý hàng nghìn tệp PDF, mỗi tệp yêu cầu OCR, trích xuất và phân tích. Mỗi tài liệu được cấp một tác tử phụ với đầy đủ khả năng xử lý.
Sáng tạo đa tài sản
Tạo hàng trăm hình ảnh, video hoặc tài sản âm thanh độc đáo
Mỗi tài sản được tạo ra bởi một tác tử phụ chuyên biệt có thể khám phá đầy đủ không gian sáng tạo mà không bị ràng buộc bởi ngữ cảnh.
Phân tích dữ liệu quy mô lớn
Phân tích đồng thời nhiều bộ dữ liệu, mỗi bộ yêu cầu một quy trình xử lý và phương pháp phân tích khác nhau.
Phân tách quy trình phức tạp
Chia nhỏ các quy trình phức tạp, đa bước thành các thành phần có thể chạy song song, thực hiện chúng đồng thời và tổng hợp kết quả.
Mô hình này mang tính phổ quát: bất kỳ nhiệm vụ nào có thể được phân tách thành các nhiệm vụ phụ độc lập đều có thể hưởng lợi từ mô hình thực thi song song này.
Giao tiếp và điều phối giữa các tác tử
Hiệu quả của Wide Research phụ thuộc vào cách các tác tử phụ được điều phối mà không tạo ra các nút thắt cổ chai mới.
Giao tiếp theo mô hình trung tâm-và-nhánh
Các tác tử phụ chỉ giao tiếp với bộ điều khiển chính, không bao giờ giao tiếp với nhau. Cấu trúc liên kết trung tâm-nhánh này ngăn chặn:
•Ô nhiễm ngữ cảnh: Giả định hoặc lỗi của một tác nhân phụ ảnh hưởng đến công việc của tác nhân khác.
•Chi phí phối hợp: Sự tăng trưởng theo cấp số nhân trong độ phức tạp của giao tiếp ngang hàng.
•Vấn đề đồng bộ hóa: Các điều kiện đua và vấn đề nhất quán trong hệ thống phân tán.
Tác nhân phụ phi trạng thái
Mỗi tác nhân phụ đều phi trạng thái và tạm thời. Nó nhận một đặc tả nhiệm vụ, thực thi, trả về kết quả và bị kết thúc. Thiết kế này đảm bảo:
•Tách biệt rõ ràng: Không có sự phụ thuộc ẩn giữa các nhiệm vụ phụ.
•Khả năng chịu lỗi: Một tác nhân phụ bị lỗi có thể được khởi động lại mà không ảnh hưởng đến các tác nhân khác.
•Hiệu quả tài nguyên: Các tác nhân phụ được tạo theo nhu cầu và giải phóng ngay lập tức sau khi hoàn thành.
Mở rộng động
Hệ thống không phân bổ trước một nhóm cố định các tác nhân phụ. Nó mở rộng động dựa trên:
•Độ phức tạp của nhiệm vụ: Các nhiệm vụ phụ phức tạp hơn có thể được phân bổ thêm tài nguyên.
•Tải hệ thống: Các tác nhân phụ được lên lịch để tối ưu hóa thông lượng tổng thể.
•Ràng buộc chi phí: Hệ thống có thể hoạt động trong phạm vi ngân sách tài nguyên được chỉ định.
Tác động thực tế đến công việc chuyên nghiệp
Đối với các chuyên gia dựa vào AI để nghiên cứu và phân tích, Wide Research thay đổi căn bản những gì có thể thực hiện được.
Thông tin thị trường
Phân tích hàng chục hoặc hàng trăm đối thủ cạnh tranh, phân khúc thị trường, hoặc nhóm khách hàng với độ sâu nhất quán. Không còn phải xác minh thủ công các mục nhập sau này. Không còn phải thắc mắc liệu AI có bịa đặt so sánh tính năng đó hay không.
Nghiên cứu học thuật
Xem xét hàng trăm bài báo, tổng hợp các phát hiện từ một khối lượng lớn tài liệu. Mỗi bài báo đều nhận được phân tích kỹ lưỡng, không phải đọc lướt hời hợt và suy giảm chất lượng khi số lượng tăng lên.
Thẩm định
Điều tra nhiều công ty, sản phẩm, hoặc cơ hội song song. Các quyết định quan trọng xứng đáng được phân tích nhất quán—không phải nghiên cứu suy giảm sau vài mục đầu tiên.
Sáng tạo nội dung
Tạo ra khối lượng lớn nội dung độc đáo, chất lượng cao. Mỗi tác phẩm đều nhận được sự chú ý sáng tạo đầy đủ, không phải là hiệu suất giảm dần do bối cảnh bị hạn chế.
Vượt ra ngoài Mô hình Đơn xử lý
Wide Research không chỉ là một tính năng—nó đại diện cho một sự thay đổi cơ bản từ mô hình đơn xử lý sang một kiến trúc song song có tổ chức. Tương lai của các hệ thống AI không nằm ở các cửa sổ ngữ cảnh ngày càng lớn, mà ở việc phân tách thông minh nhiệm vụ và thực thi song song.
Chúng ta đang chuyển từ kỷ nguyên "trợ lý AI" sang kỷ nguyên "lực lượng lao động AI."
Khi nào nên sử dụng Wide Research: Bất kỳ nhiệm vụ nào liên quan đến nhiều mục tương tự nhau đòi hỏi phân tích nhất quán—nghiên cứu cạnh tranh, đánh giá tài liệu, xử lý hàng loạt, tạo ra nhiều tài sản.
Khi nào không nên sử dụng: Các nhiệm vụ tuần tự sâu mà mỗi bước phụ thuộc nhiều vào kết quả trước đó, hoặc các nhiệm vụ nhỏ (ít hơn 10 mục) mà việc xử lý đơn xử lý hiệu quả về chi phí hơn.
Nghiên Cứu Rộng dành cho tất cả người đăng ký
Bước nhảy vọt về kiến trúc từ một trợ lý AI đơn lẻ đến một lực lượng phối hợp của các tác nhân phụ hiện đã có sẵn cho tất cả người đăng ký. Đây là một mô hình mới cho nghiên cứu và phân tích được hỗ trợ bởi AI.
Chúng tôi mời bạn trải nghiệm sự khác biệt một cách trực tiếp. Hãy mang theo những thách thức nghiên cứu quy mô lớn của bạn—những thách thức mà bạn nghĩ là không thể đối với AI—và chứng kiến cách tiếp cận xử lý song song mang lại kết quả chất lượng cao, nhất quán ở quy mô lớn.
Kỷ nguyên của lực lượng AI đã đến. Bắt đầu nhiệm vụ Nghiên Cứu Rộng của bạn ngay hôm nay.
Less structure,
more intelligence.
Tài nguyên
Ứng dụng WindowsAPIGói nhómKhởi nghiệpPlaybookTrung tâm trợ giúpTrung tâm tin cậyTài sản thương hiệuSo sánh
So với ChatGPT© 2025 Manus AI · Singapore.