News

Решението на AI за "коктейлния партиен проблем", използвано в съда

22/09/2024 16:46

Това е многогодишният проблем на коктейл партито - да стоиш в стая, пълна с хора, да пиеш в ръка, опитвайки се да чуеш какво казва колегата ти гост.
Всъщност, човешките същества са забележително умели в провеждането на разговор с един човек, докато филтрират конкуриращи се гласове.
Въпреки това, може би изненадващо, това е умение, което технологията доскоро не беше в състояние да възпроизведе.
И това има значение, когато става въпрос за използване на аудио доказателства в съдебни дела.
Гласовете на заден план могат да затруднят да бъдат сигурни кой говори и какво се казва, като потенциално правят записите безполезни.
Електрическият инженер Кийт Макелвийн, основател и главен технологичен директор на Wave Sciences, се заинтересува от проблема, когато работи за правителството на САЩ по дело за военни престъпления.
Това, което се опитвахме да разберем е кой е наредил избиването на цивилни.
Някои от доказателствата включваха записи с куп гласове, всички говорещи едновременно - и това, когато научих какъв е проблемът с коктейлното парти, казва той.
Имах успех в премахването на шума като автомобилни звуци или климатици или вентилатори от речта, но когато започнах да се опитвам да премахна речта от речта, се оказа не само много труден проблем, това беше един от класическите трудни проблеми в акустиката.
Звуците подскачат около една стая и е математически ужасно да се реши.
Отговорът, казва той, е да се използва AI, за да се опита да определи и отсее всички конкурентни звуци въз основа на това откъде първоначално са дошли в една стая.
Това не означава само други хора, които могат да говорят - има и значително количество смущения от начина, по който звуците се отразяват в една стая, като гласът на целевите говорители се чува както пряко, така и косвено.
В перфектна анехоична камера - един напълно свободен от ехо - един микрофон на високоговорител би бил достатъчен, за да се разбере какво казват всички; но в истинска стая проблемът изисква микрофон и за всеки отразен звук.
Г-н Макелвийн основава Wave Sciences през 2009 г., надявайки се да разработи технология, която може да раздели припокриващите се гласове.
Първоначално фирмата използва голям брой микрофони в това, което е известно като масивно гредообразуване.
Въпреки това, обратната връзка от потенциалните търговски партньори е, че системата изисква твърде много микрофони за разходите, за да даде добри резултати в много ситуации - и изобщо не би се представила в много други.
Общият рефрен беше, че ако можем да измислим решение, което да отговори на тези опасения, те ще бъдат много заинтересовани, казва г-н Макелвийн.
И добавя: Знаехме, че трябва да има решение, защото можете да го направите само с две уши.
Компанията най-накрая реши проблема след 10 години вътрешно финансирани изследвания и подаде заявка за патент през септември 2019 г.
Това, което са измислили, е изкуствен интелект, който може да анализира как звукът отскача из стаята, преди да достигне микрофона или ухото.
Улавяме звука, когато той пристига на всеки микрофон, назад, за да разберем откъде идва, и след това, по същество, потискаме всеки звук, който не може да е дошъл от мястото, където човекът седи, казва г-н Макелвийн.
Ефектът е сравним в някои отношения с това, когато камерата се фокусира върху един обект и размива преден план и фон.
"Резултатите не звучат кристално ясно, когато можете да използвате само много шумен запис, за да се учите от него, но все пак са зашеметяващи.
Технологията има първата си реална съдебна употреба в случай на убийство в САЩ, където доказателствата, които е в състояние да предостави, се оказват централни за присъдите.
След като двама наемни убийци са арестувани за убийството на човек, ФБР иска да докаже, че са били наети от семейство, което преминава през спор за попечителство на дете.
ФБР уредило да подмамят семейството да вярва, че са били изнудвани за участието си - и след това седнали да видят реакцията.
Докато съобщенията и телефонните обаждания са били сравнително лесни за достъп за ФБР, личните срещи в два ресторанта са били различен въпрос.
Но съдът разрешил използването на алгоритъма на Wave Sciences, което означава, че аудиото се превърнало от недопустимо в основно доказателство.
Оттогава други правителствени лаборатории, включително и в Обединеното кралство, са го подложили на серия от тестове.
Сега компанията продава технологията на американските военни, които я използват за анализ на сонарните сигнали.
Също така може да има приложения в преговорите за заложници и сценариите за самоубийство, казва г-н Макелвийн, за да се увери, че и двете страни на разговора могат да бъдат чути - не само преговарящият с мегафон.
В края на миналата година компанията пусна софтуерно приложение, използващо своя учебен алгоритъм за използване от правителствени лаборатории, извършващи аудио криминалистика и акустичен анализ.
В крайна сметка тя има за цел да въведе персонализирани версии на своя продукт за използване в комплект за аудио запис, гласови интерфейси за автомобили, интелигентни високоговорители, разширена и виртуална реалност, сонар и слухови апарати.
Така например, ако говорите с колата или интелигентния си говорител, няма да има значение дали около вас има много шум, устройството все още ще може да разбере какво казвате.
AI вече се използва и в други области на криминалистиката, според съдебния педагог Тери Армента от Съдебната научна академия.
Моделите на ML [машинно обучение] анализират гласовите модели, за да определят идентичността на говорителите, процес, който е особено полезен в наказателните разследвания, където гласовите доказателства трябва да бъдат удостоверени, казва тя.
Освен това инструментите за изкуствен интелект могат да откриват манипулации или промени в аудиозаписите, осигурявайки целостта на доказателствата, представени в съда.
И AI също си пробива път и в други аспекти на аудио анализа.
Bosch има технология, наречена SoundSee, която използва алгоритми за обработка на аудио сигнали, за да анализира, например, звук от двигател, за да предвиди неизправност, преди да се случи.
Традиционните възможности за обработка на аудио сигнали нямат способността да разбират звука по начина, по който ние хората го правим, казва д-р Самарджит Дас, директор на научните изследвания и технологиите в Бош САЩ.
Аудио AI позволява по-дълбоко разбиране и семантична интерпретация на звука на нещата около нас по-добре от всякога - например, звуци от околната среда или звукови сигнали, излъчвани от машини.
По-новите тестове на алгоритъма на Wave Sciences показват, че дори само с два микрофона технологията може да работи толкова добре, колкото човешкото ухо - по-добре, когато се добавят повече микрофони.
Те разкриха и нещо друго.
Математиката във всичките ни тестове показва забележителни прилики с човешкия слух.
Има малко странности за това какво може да направи нашият алгоритъм и колко точно може да го направи, които са удивително подобни на някои от странностите, които съществуват в човешкия слух, казва Макелвийн.
Подозираме, че човешкият мозък може да използва същата математика - че при решаването на проблема с коктейлното парти, може да сме се натъкнали на това, което наистина се случва в мозъка.

Other Articles in News

Защо и бизнесът, и измамниците обичат платежната система на Индия

Всеки ден, през последните седем години, Арун Кумар е организирал сергията си за плодове на оживена улица в Мумбай. Това не е лесен начин за изкарване на прехраната. Да бъдеш уличен продавач е предизвикателство. Има страх да не бъда ограбен или, тъй като не съм лицензиран продавач, местният орган мо...

Как AI подхранва несигурността за разработчиците на игри

Много съм наясно, че мога да се събудя утре и работата ми може да изчезне", казва Джес Хайланд. Художничката на видеоигри казва, че индустрията, в която е работила почти 15 години, в момента е наразтърсена" почва. Бум на играчи и печалби по време на пандемията предизвика вълна от инвестиции, разшире...

Как ще изглеждат бъдещите въздушни боеве с кучета?

Летя с изтребител тайфун над Ирландско море и имам голям проблем. На опашката ми има враждебен самолет и без значение как натискам джойстика или си играя с газта, този враг все още е там. Заплахата е представена от черен триъгълник на компютърния екран пред мен, който също показва тайфунен кокпит. А...

Защо технологичните братя се обръщат към Тръмп

Доналд Тръмп, чието време го превърна в парий за мнозина в света на бизнеса, намери нови шампиони сред технологичните лидери, докато пътят му обратно към Белия дом се оформя. Илон Мъск, най-богатият човек в света, се превърна в най-голямото име, което досега е хвърляло тежестта си зад бившия президе...

Състезателите по риалити не изглеждат истински.

Валери Пенсо-Кукулич знае едно-две неща за избора на състезатели за риалити шоута. Тя е режисьор на кастинги за такива програми като Love Island USA, The Real Housewives of Dubai и The Millionaire Matchmaker. Г-жа Пенсо-Кукулич казва, че изкуственият интелект е направил първия контакт с кандидатите...

Може ли технологията да поправи "счупената" система за издаване на билети за концерти?

За родния Нашвил Джаки Трап, който лети за Европа това лято, за да види идола си Тейлър Суифт на живо, беше "без мозък". С най-евтините билети за оставащите американски дати от продължаващото турне на Суифт Eras Tour, което сега струва 2500 долара ( 2,000) на пазара за препродажба, в сравнение с ном...

Дали улавянето на въглерод е ефективен начин за справяне с CO2?

Може да е сцена от научна фантастика. Извисяващите се над тъмни, мъхести полета от лава са купища шумни машини с размерите на контейнери за корабоплаване, куполи и зиг-заг сребърни тръби. Намира се на 30 км (19 мили) югозападно от столицата на Исландия Рейкявик, това е най-голямото в света съоръжени...

Може ли Австралия да се превърне в зелена водородна суперсила?

"Ако си спомняте, че сте били дете и взривявате балон или в млечен шейк, бузите ви се възпаляват, защото има енергийно наказание, свързано с образуването на балони." Пол Барет, роденият в Дъблин главен изпълнителен директор на австралийската фирма за зелена енергия Hysata, обяснява плана за създаван...

"Суперхраната" превзема нивите в Северна Индия

Подобно на баща си и дядо си преди него, Пул дев Шахни веднъж изкарва прехраната си, като се гмурка на дъното на кални водоеми с дълбочина 8 фута (2,4 м). Преди се гмурках в 7 до 8 фута вода в продължение на часове на ден - излизах на повърхността, за да дишам след 8 до 10 минути, обяснява г-н Шахни...

Без смях - как AI помага на комиците да пишат шеги

Защо политикът донесе стълба на дебата? За да се увери, че може да достигне нови висоти с обещанията си!" Помолете AI да напише политическа шега, а горното е пример за това, което можете да получите. Може би не достатъчно смешно, за да се представи на сцената пред платена публика, но това не означав...