В Anthropic запропонували стандарти прозорості для розробників ШІ

Фахівці Anthropic представили «фреймворк прозорості» для розробників прогресивних ШІ, щоб запобігти можливим катастрофічним наслідкам ще до їх реалізації.

«Необхідно вжити проміжних заходів, щоб забезпечити безпечну, відповідальну та прозору розробку надзвичайно потужного штучного інтелекту», — підкреслили в компанії.

У документі описується створення гнучкої системи основних вимог без жорсткого регулювання, яке могло б загальмувати інновації. Рекомендується зосередитися лише на найбільших учасниках ринку — наприклад, на тих, чий бюджет на R&D перевищує $1 млрд або річний дохід становить $100 млн.

Відповідно до запропонованих правил Anthropic, розробники потужних ШІ повинні:

  • створити рамки безпеки для розробки — враховувати ризики, пов’язані зі створенням біологічної, хімічної або ядерної зброї, а також загрози від автономних моделей;
  • публікувати політику безпечної розробки та самостійно підтверджувати її дотримання;
  • оприлюднити опис тестування, оцінок і заходів безпеки для кожної моделі під час запуску або значних оновлень;
  • нести юридичну відповідальність за неправдиві заяви про дотримання політики безпечної розробки, а також захищати свідків, які виявляють порушення;
  • обрати практичні стандарти безпеки з урахуванням динаміки та розвитку індустрії ШІ.

У документі наведені приклади добровільних стандартів безпеки від OpenAI, DeepMind, Microsoft та самої Anthropic. 

На думку авторів, законодавче закріплення запропонованого фреймворку може унеможливити повернення до старих практик у майбутньому, коли моделі стануть ще більш автономними.

«Без відповідальної та безпечної розробки навіть одна помилка може зупинити прогрес на десятиліття», — зазначають в Anthropic.

Нагадаємо, що у червні дослідники компанії звернули увагу на здатність більших сучасних моделей ШІ до шантажу.

Источник

No votes yet.
Please wait...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *

Цей сайт використовує Akismet для зменшення спаму. Дізнайтеся, як обробляються дані ваших коментарів.