Các hệ thống AI nhanh nhất cũng là những thứ bạn biết ít nhất

Có một sự đánh đổi mà tôi liên tục gặp phải mà chẳng ai dám nói thẳng. Hệ thống càng được tối ưu hóa cho tốc độ, thì nó càng nén lại hoặc hoàn toàn loại bỏ các lớp cho phép bạn kiểm tra những gì thực sự đang diễn ra bên trong.

Tôi nhận ra điều này đầu tiên trong cơ sở hạ tầng tài chính, thật kỳ lạ. Các hệ thống giao dịch tần số cao cực kỳ hiệu quả. Chúng cũng cực kỳ mờ mịt. Tốc độ và sự xem xét có vẻ như đang đẩy nhau ra trong cấp độ kiến trúc.

Tôi đã nghĩ rằng các hệ thống AI sẽ khác. Mở hơn, có thể, vì lĩnh vực này lớn lên song song với văn hóa mã nguồn mở.

Càng tìm hiểu, tôi nhận ra rằng giả định đó không thực sự đúng.

Hầu hết các suy diễn AI sản xuất được tối ưu hóa cho thông lượng. Thời gian trễ được tối thiểu hóa. Chi phí overhead bị loại bỏ. Và trong một số khía cạnh của quá trình đó, diện tích bề mặt có sẵn cho việc xem xét an ninh, xác minh bên ngoài, hoặc kiểm toán trung thực lặng lẽ thu hẹp lại.

Điều làm tôi bận tâm là chúng ta có xu hướng đánh giá các hệ thống AI dựa trên chất lượng đầu ra và tốc độ phản hồi, gần như không bao giờ xem xét mức độ mà quy trình nội bộ của chúng thực sự có thể được kiểm tra.

Đây là sự căng thẳng mà tôi liên tục trở lại khi nghĩ về những gì @OpenGradient đang cố gắng giải quyết. Cách tiếp cận $OPG dường như coi khả năng xác minh không phải là một chi phí hiệu suất mà là một ràng buộc thiết kế đáng được bảo tồn.

Tôi không chắc sự đánh đổi đó có thể được giải quyết xa đến đâu. Có thể hiệu quả và an ninh không nhất thiết phải là những điều đối lập trong cơ sở hạ tầng AI.

Hoặc có thể mỗi hệ thống càng nhanh thì càng âm thầm trở nên khó tin tưởng hơn. #OPG

#opg $OPG @OpenGradient