Онтология требует проверки человеком данных обучения ИИ без ущерба для конфиденциальности

Онтология привлекает внимание к растущей проблеме в мире ИИ: как доказать, что часть обучающих данных поступила от реального человека, не превращая при этом весь процесс в кошмар конфиденциальности?

В недавнем сообщении участники проекта утверждали, что ответом не должно быть усиление слежки. Вместо того, чтобы просить участников сдавать селфи, удостоверения личности, биометрические сканы и другие личные данные, Ontology утверждает, что отрасль должна опираться на проверяемые учетные данные и выборочное раскрытие информации, чтобы люди могли доказать, что они люди, не раскрывая при этом все о себе.

Эта идея сейчас имеет большее значение, чем год назад. Обсуждение данных обучения ИИ явно изменилось. Раньше речь шла главным образом о масштабе, объеме и объеме данных, которые вы могли собрать. Теперь более серьезный вопрос заключается в том, откуда взялись эти данные, действительно ли они созданы человеком и насколько они уже загрязнены синтетическим контентом.

Эта проблема больше не является нишевой проблемой. Это стало одной из самых больших головных болей, с которыми сталкиваются команды ИИ, пытающиеся создать более чистые и надежные модели. В Ontology говорят, что рынок уже начинает относиться к доказательству личности как к ценному активу. Проверенные человеческие данные становятся чем-то, за что компаниям, возможно, придется платить дополнительно.

Спрос растет, но предложение ограничено, а то, как многие платформы планируют проверять людей, по мнению компании, глубоко ошибочно. Самый простой путь для большинства платформ также является и самым агрессивным.

Если они хотят знать, является ли кто-то человеком, они обычно запрашивают все больше и больше личной информации. Им может потребоваться селфи, удостоверение личности государственного образца, проверка работоспособности, отслеживание поведения, снятие отпечатков пальцев с устройства или сочетание всего вышеперечисленного.

Каждый уровень может сделать проверку более уверенной, но это также означает, что пользователь отказывается от большей конфиденциальности. Со временем человек, пытающийся доказать, что они настоящие, разбивается на набор данных, хранящихся в чужих системах. Онтология утверждает, что это неправильный компромисс.

В компании говорят, что проблема не в том, что людей нужно проверять. Проблема в том, что нынешняя модель предполагает, что проверка должна сопровождаться постоянным раскрытием информации. Вот что происходит, когда отрасль использует централизованные инструменты, предназначенные для сбора как можно большего количества данных. На практике ценой доверия становится человек.

Настоящий прорыв

Альтернатива, на которую указывает Онтология, построена на основе модели данных 2.0 проверяемых учетных данных W3C, которая была объявлена в качестве рекомендации в мае 2025 года. Идея довольно проста, даже если лежащая в ее основе криптография не такова: доверенный эмитент, такой как правительство, банк или поставщик услуг проверки, может один раз подтвердить что-то о человеке, и эти учетные данные могут храниться на собственном устройстве пользователя.

Когда позже платформе потребуется узнать, является ли этот человек человеком, пользователь может предоставить криптографическое доказательство вместо того, чтобы передавать всю базовую запись. Это означает, что проверяющий получает то, что ему нужно, и ничего больше.

Он узнает, что доверенный эмитент подтвердил, что это человек. Он не видит полную идентификационную информацию человека, биометрические данные или другие дополнительные сведения. Нет необходимости связываться с эмитентом каждый раз, когда используются учетные данные, и пользователю не приходится оставлять след связываемых идентификаторов на разных платформах.

Онтология утверждает, что настоящим прорывом здесь является выборочное раскрытие информации. Именно это делает систему действительно сохраняющей конфиденциальность. Учетные данные могут содержать много информации, но пользователь раскрывает только ту часть, которая имеет значение для конкретного запроса. Так что, если платформе нужно только доказательство личности, она получит именно это и ничего больше.

Никаких лишних личных данных, никакой биометрии, никаких повторно используемых фрагментов профиля, которые можно было бы потом сшить. В качестве примеров такого подхода на практике компания также указала на свою собственную работу в области децентрализованной идентификации, включая $ONT ID и ONTO Wallet.

Согласно Ontology, эти инструменты предназначены для хранения учетных данных на устройстве и позволяют пользователям генерировать доказательства локально, не раскрывая свои личные данные эмитентам или проверяющим. Однако более важный вопрос касается не только Онтологии. Речь идет о том, куда движется инфраструктура искусственного интеллекта.

Поскольку компании стремятся очистить свои данные обучения и выяснить, чему еще можно доверять, необходимость проверки людей, участвующих в работе, будет только расти. Реальный вопрос заключается в том, решит ли отрасль эту проблему, встраивая в систему больше наблюдения, или используя системы, которые позволяют людям доказывать свою реальность, не отказываясь при этом от своей конфиденциальности.

Онтология явно делает ставку на второй вариант. А поскольку компании, занимающиеся ИИ, теперь больше беспокоятся о происхождении, чем о количестве, эта ставка может начать выглядеть не как нишевый аргумент в пользу конфиденциальности, а скорее как практическое требование для следующего этапа сбора данных ИИ.