Với Operator, OpenAI tiến thêm một bước nữa trong việc tích hợp trí tuệ nhân tạo vào cuộc sống hàng ngày. Tác nhân này, tận dụng khả năng suy luận nâng cao của GPT-4, có thể tương tác trực tiếp với các trang web thông qua trình duyệt tích hợp.
Đăng ký 01net Tác nhân Operator dựa trên mô hình có tên là "Computer-Using Agent", kết hợp các tính năng thị giác máy tính tiên tiến và khả năng suy luận được tăng cường bằng máy học. Trên thực tế, công cụ này có thể tham khảo các trang web, tương tác với chúng bằng cách mô phỏng các hành động của bàn phím và chuột, thậm chí tự sửa khi gặp chướng ngại vật.
OpenAI chỉ rõ rằng tác nhân này có thể thực hiện nhiều tác vụ khác nhau, chẳng hạn như đặt chỗ tại nhà hàng hoặc gọi dịch vụ thông qua các nền tảng đối tác (hiện tại là American) như DoorDash, Uber hoặc Instacart. Không giống như tích hợp dựa trên API, Operator hoạt động tự động thông qua ảnh chụp màn hình và tương tác thời gian thực với GUI của trang web. Nhưng công cụ này cũng có những hạn chế: các giao diện phức tạp, chẳng hạn như tạo bài thuyết trình hoặc quản lý lịch, vẫn có thể gây khó khăn.
Trình điều hành được thiết kế để yêu cầu người dùng chấp thuận trước khi thực hiện các hành động nhạy cảm, chẳng hạn như gửi email hoặc nhập thông tin bí mật. Ngoài ra, nó còn từ chối các yêu cầu có thể bị coi là có hại hoặc không phù hợp.
Hiện tại, Operator chỉ khả dụng tại Hoa Kỳ và dành riêng cho những người đăng ký gói ChatGPT Pro có giá 200 đô la mỗi tháng. OpenAI có kế hoạch mở rộng dần quyền truy cập vào các loại đăng ký khác, chẳng hạn như Plus, Team và Enterprise, và tích hợp các tính năng của Operator trực tiếp vào ChatGPT.
Mặc dù công cụ này có vẻ đầy hứa hẹn, OpenAI khuyến cáo nên thận trọng, lưu ý rằng Operator vẫn đang trong giai đoạn thử nghiệm và có thể không hoạt động tối ưu trong một số trường hợp. Nếu bạn muốn sử dụng ở Pháp và sẵn sàng chi 200 đô la, bạn luôn có thể sử dụng VPN tốt để khiến công cụ của OpenAI tin rằng bạn đang ở Hoa Kỳ.
Nguồn: OpenAI
Operator: AI tự động mới cho web
Đăng ký 01net Tác nhân Operator dựa trên mô hình có tên là "Computer-Using Agent", kết hợp các tính năng thị giác máy tính tiên tiến và khả năng suy luận được tăng cường bằng máy học. Trên thực tế, công cụ này có thể tham khảo các trang web, tương tác với chúng bằng cách mô phỏng các hành động của bàn phím và chuột, thậm chí tự sửa khi gặp chướng ngại vật.
OpenAI chỉ rõ rằng tác nhân này có thể thực hiện nhiều tác vụ khác nhau, chẳng hạn như đặt chỗ tại nhà hàng hoặc gọi dịch vụ thông qua các nền tảng đối tác (hiện tại là American) như DoorDash, Uber hoặc Instacart. Không giống như tích hợp dựa trên API, Operator hoạt động tự động thông qua ảnh chụp màn hình và tương tác thời gian thực với GUI của trang web. Nhưng công cụ này cũng có những hạn chế: các giao diện phức tạp, chẳng hạn như tạo bài thuyết trình hoặc quản lý lịch, vẫn có thể gây khó khăn.
Vẫn cần có sự kiểm soát của con người
Trình điều hành được thiết kế để yêu cầu người dùng chấp thuận trước khi thực hiện các hành động nhạy cảm, chẳng hạn như gửi email hoặc nhập thông tin bí mật. Ngoài ra, nó còn từ chối các yêu cầu có thể bị coi là có hại hoặc không phù hợp.
Hiện tại, Operator chỉ khả dụng tại Hoa Kỳ và dành riêng cho những người đăng ký gói ChatGPT Pro có giá 200 đô la mỗi tháng. OpenAI có kế hoạch mở rộng dần quyền truy cập vào các loại đăng ký khác, chẳng hạn như Plus, Team và Enterprise, và tích hợp các tính năng của Operator trực tiếp vào ChatGPT.
Mặc dù công cụ này có vẻ đầy hứa hẹn, OpenAI khuyến cáo nên thận trọng, lưu ý rằng Operator vẫn đang trong giai đoạn thử nghiệm và có thể không hoạt động tối ưu trong một số trường hợp. Nếu bạn muốn sử dụng ở Pháp và sẵn sàng chi 200 đô la, bạn luôn có thể sử dụng VPN tốt để khiến công cụ của OpenAI tin rằng bạn đang ở Hoa Kỳ.
Nguồn: OpenAI