Anthropic đã ra mắt thế hệ mô hình AI mới cho bot Claude của mình. Claude Opus 4 và Claude Sonnet 4 tự giới thiệu mình là những nhà vô địch về mã, “lý luận nâng cao” và AI tác nhân. Điều này hoàn toàn trái ngược với sự cường điệu thường thấy của OpenAI, vốn dễ dàng truyền đạt về công cụ tạo hình ảnh của mình với tính lan truyền được cho là có. ChatGPT cũng có những khả năng nghiêm túc hơn, nhưng Claude hướng đến nhiều đối tượng chuyên nghiệp hơn.
Mặc dù không mạnh bằng người anh lớn của mình là Opus, nhưng Claude Sonnet 4 mang đến những cải tiến "đáng kể" so với mẫu 3.7 trước đó. Nó hướng nhiều hơn đến các nhiệm vụ hàng ngày.
Anthropic cũng đã giảm đáng kể các hành vi né tránh (sử dụng lối tắt hoặc kẽ hở) khá phổ biến với Sonnet 3.7 khi không rõ cách hoàn thành một nhiệm vụ. Cả hai mô hình đều có khả năng biểu hiện hành vi này ít hơn 65% trên các tác vụ tác nhân đặc biệt dễ bị tấn công.
Khi nhà phát triển cấp cho Claude Opus 4 quyền truy cập vào các tệp được lưu trữ trên máy tính của họ, mô hình hiện sẽ duy trì "tệp bộ nhớ" để lưu trữ thông tin quan trọng. Điều này đảm bảo tính nhất quán cao hơn và cải thiện hiệu suất thực hiện nhiệm vụ của tác nhân. Công ty khởi nghiệp đưa ra ví dụ về hướng dẫn điều hướng cho trò chơi Pokémon: tác nhân ghi lại thông tin quan trọng để cải thiện trò chơi của mình!
Do đó, các mô hình này ngày càng thông minh hơn và các nhà phát triển chắc chắn sẽ tìm thấy những ứng dụng phù hợp. Nhưng điều này cũng không tránh khỏi những vấn đề về an ninh. Vào năm 2023, Anthropic cam kết không phân phối các mô hình cho đến khi phát triển được các biện pháp bảo mật để hạn chế những mục đích sử dụng độc hại nhất.
Claude Opus 4 được ra mắt với các biện pháp bảo mật nâng cao có tên là "ASL-3" (Cấp độ an toàn AI 3), là biện pháp nghiêm ngặt nhất từng được Anthropic áp dụng. Nếu không có biện pháp bảo vệ này, AI có thể tạo điều kiện cho những người có kiến thức khoa học cơ bản tiếp cận, sản xuất hoặc triển khai vũ khí hóa học, sinh học hoặc hạt nhân! Các biện pháp này bao gồm tăng cường an ninh mạng, bảo vệ chống lại việc lách luật hạn chế và các hệ thống bổ sung để phát hiện và từ chối một số hành vi nguy hiểm. Phù.
Những mẫu mới này hiện đã có sẵn cho những người đăng ký trả phí. Sonnet 4 cũng có sẵn cho người dùng miễn phí.
Nguồn: Anthropic
AI được giám sát chặt chẽ
Và nhóm mô hình mới này có mục đích chứng minh điều đó. Claude Opus 4 là mô hình mạnh mẽ nhất của Anthropic và được thiết kế để thực hiện tốt các tác vụ dài hạn đòi hỏi hàng nghìn bước. Máy có khả năng chạy trong nhiều giờ, cho phép máy hoạt động tốt hơn các mẫu Sonnet khác.Anthropic cũng đã giảm đáng kể các hành vi né tránh (sử dụng lối tắt hoặc kẽ hở) khá phổ biến với Sonnet 3.7 khi không rõ cách hoàn thành một nhiệm vụ. Cả hai mô hình đều có khả năng biểu hiện hành vi này ít hơn 65% trên các tác vụ tác nhân đặc biệt dễ bị tấn công.
Khi nhà phát triển cấp cho Claude Opus 4 quyền truy cập vào các tệp được lưu trữ trên máy tính của họ, mô hình hiện sẽ duy trì "tệp bộ nhớ" để lưu trữ thông tin quan trọng. Điều này đảm bảo tính nhất quán cao hơn và cải thiện hiệu suất thực hiện nhiệm vụ của tác nhân. Công ty khởi nghiệp đưa ra ví dụ về hướng dẫn điều hướng cho trò chơi Pokémon: tác nhân ghi lại thông tin quan trọng để cải thiện trò chơi của mình!

Do đó, các mô hình này ngày càng thông minh hơn và các nhà phát triển chắc chắn sẽ tìm thấy những ứng dụng phù hợp. Nhưng điều này cũng không tránh khỏi những vấn đề về an ninh. Vào năm 2023, Anthropic cam kết không phân phối các mô hình cho đến khi phát triển được các biện pháp bảo mật để hạn chế những mục đích sử dụng độc hại nhất.
Claude Opus 4 được ra mắt với các biện pháp bảo mật nâng cao có tên là "ASL-3" (Cấp độ an toàn AI 3), là biện pháp nghiêm ngặt nhất từng được Anthropic áp dụng. Nếu không có biện pháp bảo vệ này, AI có thể tạo điều kiện cho những người có kiến thức khoa học cơ bản tiếp cận, sản xuất hoặc triển khai vũ khí hóa học, sinh học hoặc hạt nhân! Các biện pháp này bao gồm tăng cường an ninh mạng, bảo vệ chống lại việc lách luật hạn chế và các hệ thống bổ sung để phát hiện và từ chối một số hành vi nguy hiểm. Phù.
Những mẫu mới này hiện đã có sẵn cho những người đăng ký trả phí. Sonnet 4 cũng có sẵn cho người dùng miễn phí.
Nguồn: Anthropic