На початку минулого місяця Tumblr оголосив, що буде банити порно. Коли нова політика у відношенні вмісту вступила в силу, приблизно через два тижні — 17 грудня — стало очевидно, що будуть проблеми. Після розгортання системи штучного інтелекту, яка повинна була перебанить всю порнографію на сайті, вона помилково позначила невинні пости в 455,4 мільйона блогах на сайті серед 168,2 мільярда постів: вази, відьом, риб і все таке інше.
Хоча незрозуміло, який автоматичний фільтр використовував Tumblr або створював свій власний — компанія не відповіла на запити по цій темі, очевидно, що соціальна мережа застрягла між власною політикою і технологіями. Наприклад, непослідовна позиція сайту в відношенні жінок, які демонструють соски» і художньої наготи, наприклад, призвела до контекстуальним рішень, які демонструють, що навіть Tumblr не знає, що забороняти у себе на платформі. Як частою компанії визначити, що вона вважає непристойним?
По-перше, блокувати ризикований контент важко, тому що спочатку складно визначити, що це таке. Визначення непристойності — ведмежий капкан, яким більше ста років, ще в 1896 році Сполучені Штати вперше прийняли закони, що регулюють непристойність. У 1964 році у справі Джакобеллиса проти Огайо щодо того, може чи Огайо заборонити показ фільму Луї Маля, Верховний суд видав, напевно, саме знамените визначення жорсткої порнографії на сьогодні: «Я не буду намагатися і далі дати визначення такого роду матеріалу, яке, як я розумію, буде включено в стенографическое опис; і, можливо, мені ніколи не вдасться зробити це зрозуміло», - сказав суддя Поттер Стюарт. «Але я знаю, що це таке, коли бачу, і кінофільм, пов'язаний з цією справою, цим не є».
алгоритмів машинного навчання та ж проблема. Саме цю проблему намагається вирішити Брайан Делордж, CEO Picnix, компанії, яка продає спеціалізовану технологію штучного інтелекту. Один з їхніх продуктів — Iris — являє собою додаток на стороні клієнта, яке служить для виявлення порнографії, щоб «допомогти людям», як каже Делордж, «які не хочуть порно у своєму житті». Він зазначає, що окрема проблема порно в тому, що там може бути що завгодно, купа різних речей — і зображення, які порнографічними не є, можуть мати схожі елементи. Зображення вечірки на пляжі може бути заблоковано не тому, що на ньому більше шкіри, ніж на фотографії в офісі, а тому що це на межі. «Ось чому дуже важко навчити алгоритм розпізнавання зображень всьому відразу», говорить Делордж. «Коли визначення стає складним для людей, комп'ютер теж стикається з труднощами». Якщо люди не можуть домовитися про те, що є порно, а що ні, чи може комп'ютер взагалі сподіватися дізнатися різницю?
Для того, щоб навчити ІІ виявляти порно, перше, що вам потрібно зробити, це згодувати йому порно. Багато порнографії. Де його взяти? Ну, перше, що роблять люди, це скачують купу видосов з Pornhub, XVideos, говорить Ден Шапіро, співзасновник стартапу Lemay.ai, який створює фільтри ШІ для своїх клієнтів. «Це одна з тих сірих областей правового характеру — наприклад, якщо ви навчаєтеся на контенті інших людей, належить він вам?».
Після того, як програмісти скачують тонни порно, вони вирізують з відео кадри, які порнографією не є, щоб переконатися, що використовуються кадри не призведуть до блокування рознощиків піци. Платформи платять людям, здебільшого, за межами США, за маркування подібного контенту; робота низькооплачувана і нудна, немов вводити капчу». Вони просто сидять і зазначають: це таке порно, це — ось це. Фільтрувати доводиться небагато, тому що всі порно виходить з маркуванням. Навчання йде краще, якщо використовувати не просто фотографії, а великі вибірки даних.
«Часто доводиться не просто фільтрувати порно, а швидше супутній матеріал», говорить Шапіро. «Начебто підроблених анкет з фотографією дівчини і телефоном». Він має на увазі секс-робітниць в пошуку клієнтів, але це може бути що завгодно, не зовсім законне. «Це не порно, але такого роду речей, які ви не хочете бачити на своїй платформі, так?». Хороший автоматизований модератор навчається на мільйонах — якщо не десятки мільйонів — прикладах вмісту, а значить може заощадити багато людино-годин.
«Можна порівняти це з різницею між дитиною і дорослим», говорить Метт Цейлер, генеральний директор і засновник Clarifai, стартапу області комп'ютерного зору, який здійснює таку фільтрацію зображень для корпоративних клієнтів. «Можу сказати вам точно — пару місяців тому у нас була дитина. Вони не знають нічого про світ, для них все нове». Доводиться показувати дитині (алгоритмом) багато всякого, щоб він щось зрозумів. «Мільйони і мільйони прикладів. Але будучи дорослими — коли ми створили так багато контексту про світ і зрозуміли, як він працює — ми можемо дізнаватися щось нове всього з пари прикладів». (Так, навчити ІІ фільтрувати контент для дорослих — це як показати дитині багато порно). Сьогодні компанії на зразок Clarifai швидко ростуть. У них хороша база даних про світі, вони можуть відрізняти собак від кішок, одягнених від голих. Компанія Цейлера використовує свої моделі для навчання нових алгоритмів для своїх клієнтів — оскільки вихідна модель опрацювала багато даних, персональні версії вимагатимуть лише нових наборів даних для роботи.
Тим не менш, складно алгоритмомвсе зробити правильно. З вмістом, який очевидно порнографічне, він справляється добре; але класифікатор може неправильно позначити оголошення про спідній білизні як заборонене, тому що на картинці більше шкіри, ніж, скажімо, в офісі. (З бікіні і нижньою білизною, за словами Цейлера, дуже складно). Це означає, що люди, які займаються маркуванням, повинні зосередитися на цих крайніх випадках у своїй роботі, віддаючи пріоритет того, що важко класифікувати моделі.
А що найскладніше?
«Аніме порно», говорить Цейлер. «Перша версія нашого детектора наготи не використовувала для навчання мультяшну порнографію». Багато разів ІІ байдикував, тому що не розпізнавав хентай. «Попрацювавши над цим для клієнта, ми впровадили купу його даних у модель і істотно поліпшили точність фільтра мультиплікаційних малюнків, зберігши точність реальних фотографій», говорить Цейлер.
Технологія, яка навчена винюхувати порно, може використовуватися і на інших речах. Технології, що лежать в основі цієї системи, напрочуд гнучкі. Це більше, ніж анімешні цицьки. Jigsaw від Alphabet, наприклад, широко використовується в якості автоматичного модератора коментарів у газеті. Це програмне забезпечення працює аналогічно класифікаторам зображень, за винятком того, що сортує по токсичності, а не за наготі. (Токсичність у текстових коментарях визначити так само важко, як і порнографію на знімках). Facebook використовує подібну автоматичну фільтрацію для виявлення суїцидальних повідомлень і контенту, пов'язаного з тероризмом, і він намагався використовувати цю технологію для виявлення фейкових новин на своїй масивній платформі.
Все це залежить від людського нагляду; ми краще справляємося з неоднозначністю і двозначним контекстом. Цейлер каже, що не думає, що його продукт позбавив кого-небудь роботи. Він вирішує проблему масштабування Інтернету. Люди все так само будуть навчати ІІ, сортуючи і маркуючи контент так, щоб ШІ міг його розрізняти.
Таке майбутнє модерації: індивідуальні, готові рішення, які надаються компанії, які роблю весь свій бізнес на навчанні все більш досконалих класифікаторів більшій кількості даних. Точно так само, як Stripe та Square пропонують готові платіжні рішення для підприємств, які не хочуть обробляти їх самостійно, стартапи начебто Clarifai, Picnix і Lemay.ai будуть здійснювати онлайн-модерацію.
Ден Шапіро з Lemay.ai сповнений надій. «Як і у випадку з будь-якою іншою технологією, вона все ще в процесі винаходу. Тому я не думаю, що ми поступимося в разі невдачі». Але чи зможе ШІ коли-небудь діяти автономно без нагляду людини? Незрозуміло. «Немає жодного маленького чоловічка в табакерці, який фільтрує кожен знімок», говорить він. «Потрібно отримувати дані звідусіль, щоб на них тренувати алгоритм».
Цейлер, з іншого боку, вважає, що одного разу штучний інтелект буде модерувати все самостійно. Зрештою, кількість втручань з боку людей зведеться до нуля, або до незначним зусиллям. Поступово зусилля людини перетворяться на те, що ІЇ зараз робити не може, на зразок міркувань високого рівня, самосвідомості — все, що є у людей.
Розпізнавання порнографії є частиною цього. Ідентифікація є відносно тривіальної завданням для людей, але набагато складніше навчити алгоритм розпізнавати нюанси. Визначення порогу, коли фільтр маркує зображення як порнографічне або не порнографічне, теж складне завдання, почасти математична.
Штучний інтелект — це недосконале дзеркало того, як ми бачимо світ, точно так само, як порнографія — це відображення того, що відбувається між людьми, коли вони залишаються наодинці. В ньому є частка правди, але повної картини — ні.
Не забудьте підписатися на .
Більше:
Моральний кодекс робота: чи можливо таке?
У неспокійний і , коли не все працює, як треба, а що-то взагалі докорінно змінюється, найчастіше, залишається тільки особистий моральний кодекс, який подібно компаса вказує шлях. Але що породжує моральні цінності для людини? Соціум, тепло близьких, л...
Як влаштований найскладніший робот на Землі?
Коли мова заходить про роботів, вже, здається, ніхто не уявляє собі кадри з «Термінатора». навчилися використовувати роботів на благо суспільства, і зараз під цим визначенням ховаються не тільки людиноподібні машини, але також і ті, які просто здатні...
Процес роботизації у всьому світі вже запущений
На днях Ілон Маск розкрив таємницю тисячоліття камери над дзеркалом заднього виду автомобіля Tesla Model 3. І хоча головне призначення будь-якої камери знімати те, що відбувається навколо, з'ясувалися деякі подробиці. Отже, камера буде стежити за сал...
Новини
Від паркуру до хірургії: десять новітніх досягнень робототехніки
Революція роботів, можливо, ще не настала, але наші механічні брати менші добилися серйозних успіхів. І тепер деякі з провідних експертів в цій області представили короткий перелік десяти найбільш захоплюючих новітніх розробок. У ...
Рослини надихнули науковців на створення робота
У 2014 році команда команда винахідників з італійського науково-дослідного центру в Генуї створила дерево Plantoid. Воно повністю надруковано на 3D-принтері і оснащене датчиками для вимірювання температури, вологості і розпізнаван...
Чергова перемога Deep Mind: після шахів та го штучний інтелект підкорив StarCraft
У листопаді 2017 року, тобто трохи більше року тому , що штучний інтелект поки що не в силах здолати професійних гравців . Але не пройшло і року, як і цей бар'єр виявився взято. Минулого місяця в Лондоні команда з англійської підр...
Amazon почала польові випробування своїх роботів-постачальник Scout
Компанія Amazon ось вже кілька років використовує роботів на своїх складах, намагаючись автоматизувати як можна більше етапів сортування та доставки товарів. Крім того, ще в 2016 році компанія почала користуватись дрона для достав...
Створений робот, якому не страшні ніякі перешкоди
Більшість роботів досить одноманітні: вони або ходять на двох ногах, або схожі на чотириногих собак. Дослідники з массачусетського Північно-Східного університету урізноманітнили сферу робототехніки за допомогою робота Leonardo, як...
Amazon навчила роботів не підходити близько до людей
В 2018 році компанія найняла менше робітників, ніж раніше — це явний показник того, що вона активно використовує роботів. На жаль, вони недостатньо розумні, щоб повністю замінити звичайних співробітників, тому люди змушені працюва...
Роботи з чотирма ногами стали розумнішими завдяки комп'ютерній симуляції
Без всяких сумнівів, чотириногі роботи рухаються по землі набагато впевненіше, ніж двоногі. Вони можуть легко встати після падіння, тоді як споткнувшийся робот з двома ногами може впасти і кілька хвилин борсатися на підлозі в спро...
Перший у світі «готель роботів» звільнив половину роботів
Перший в світі «готель роботів» скоротив половину своїх співробітників-роботів з-за того, що вони не справлялися зі своїми обов'язками. З 243 машин залишилася лише половина — інших замінили на людей, оскільки вважали їх прац...
#CES | Робот, який складе будь-яку вашу одяг
CES не перестає радувати цікавими , але цей пристрій ви точно захочете поставити у себе в ванній кімнаті або гардеробної. FoldiMate — справжній робот, який виконує тільки одну задачу: автоматично складає одяг, вміщену в прис...
#CES | На виставці електроніки показали унікальну роботизовану пекарню
Багато хто погодяться з тим, що немає нічого кращого аромату і смаку свіжоспеченого хліба. Але якщо ви не готові займатися його випічкою самостійно, то єдиним правильним рішенням буде – піти в найближчу пекарню. Проблема в тому, щ...
Автономний поїзд отримав звання «самого великого робота»
Головна мета виробників роботів — зробити життя людей простіше. Роботизовані системи здатні полегшити працю як простих домогосподарок, так і робітників у різноманітних сферах діяльності. Австралійсько-британська фірма Rio Tinto, щ...
LG покаже на CES-2019 новий екзоскелет і роботів-помічників
Південнокорейська компанія LG збирається привезти на Міжнародну виставку електроніки -2019, яка буде проходити на початку січня, оновлену версію розроблюваного нею екзоскелету CLOi SuitBot. Крім того, на заході компанія покаже оно...
Створена роботизована рука, яка грає на піаніно не згинаючи пальці
Наслідування рухам людських рук — здійсненне, але вельми складне завдання для роботів. Щоб навчити їх «людським» руху, розробники оснащують механізми аналогами зв'язок, м'язів, нервів і, зрозуміло, кісток і суглобів. Дослідники з ...
Створено крихітний робот для діагностики реактивних двигунів
Маленькі роботи, які здатні пролізти навіть всередину живих організмів, вже перестали бути фантастикою. У жовтні 2018 року вчені з Ексетерського університету , який переміщується в рідинах за допомогою чутливих до магнетизму джгут...
#відео | Запальна аеробіка від робота-павука компанії Robugtix
До дня, коли в наших будинках з'являться обіцяні нам фантастичними творами персональні роботи-помічники ще далеко, проте вже зараз є безліч прикладів використання машин в різних сферах, наприклад, на електростанціях. Триває розроб...
Домашні роботи та роботи-слуги: очікування і реальність
Кожен рік, всього на кілька днів у великому місті, невелика команда робототехніків втілює мрію в життя: замовляє у власних роботів-офіціантів і дворецьких. У ретельно сконструйованих репліках сцени ресторану або домашньої обстанов...
Робот влаштував «диверсію» на складі Amazon, 24 людини потрапили в лікарню
Як повідомляє порту Engadget, що функціонує на складі компанії Amazon в місті Робинсвилле (штат Нью-Джерсі) робот проткнув балончик, що містить засіб для відлякування ведмедів. Містяться в спреї речовини викликають задуху і тимчас...
Навіщо потрібні чотириногі роботи? Приклад ANYmal дає відповідь на це питання
Ми часто пишемо про чотириногих роботах. Повідомляємо які нові функції і можливості вони отримали і наскільки наблизилися до своїм реальним прототипам. Але одне питання завжди залишався нерозкритим до кінця: власне, навіщо всі ці ...
Японські інженери навчили роботів працювати в парі з людиною
Сучасна робототехніка вже досить добре розвинена. Досить подивитися хоча б на останні успіхи Boston Dynamics або згадати, що завод, на якому роботи будуть створювати інших роботів. Однак, як правило, одні роботизовані механізми до...
Новий універсальний робот для сільського господарства замінить більшість фермерських інструментів
У сучасному сільському господарстві використовується дуже багато допоміжних машин і інструментів для поліпшення виробництва. І вся ця техніка потребує не тільки відході, місце для утримання і паливі, але і часто у володінні спеціа...
Примітка (0)
Ця стаття не має коментарів, будьте першим!