Речь идет о блокировке поисковых ботов иностранных компаний, цель которых – несанкционированный сбор данных в сети, которые впоследствии могут быть использованы в том числе для обучения генеративных нейросетей. Примером поискового бота может выступать GPTbot от компании OpenAI.
По данным экспертов ГРЧЦ (подведомственное учреждение Роскомнадзора), робот может «собирать сведения об уязвимости ресурсов, персональные данные пользователей и другую чувствительную информацию», сообщается в telegram-посте ведомства. Кроме того, GPTbot уже стал самым активным поисковым ботом в российском сегменте интернета, добавили в организации.
Ведомство также сообщило, что еще в декабре прошлого года направило российским провайдерам рекомендации по выявлению и блокировке ИИ-ботов. Там подчеркнули, что провайдерам «необходимо провести ...из рисков в своей зоне ответственности и при их обнаружении применить правила блокировки сбора сведений поисковыми ботами».
Помимо GPTbot от OpenAI, в сети активно действуют Googlebot и Apple Bot, отметил член комитета Госдумы по информационной политике, информационным технологиям и связи Антон Немкин. «Фактически это веб-сканнеры, которые в автоматическом режиме посещают веб-сайты и собирают с них информацию. В дальнейшем она может быть использована не только для обучения нейросетей, но и для индексации веб-сайтов или интернет-рекламы. Помимо легитимных ботов, которых владелец сайта может с легкостью идентифицировать, в интернете также встречаются и вредоносные ИИ-ассистенты, предназначенные в том числе и для сбора чувствительной информации, в том числе пользовательских данных. Например, персональных сведений, представленных на страницах социальных сетей», – пояснил депутат.