Това е многогодишният проблем на коктейл партито - да стоиш в стая, пълна с хора, да пиеш в ръка, опитвайки се да чуеш какво казва колегата ти гост.
Всъщност, човешките същества са забележително умели в провеждането на разговор с един човек, докато филтрират конкуриращи се гласове.
Въпреки това, може би изненадващо, това е умение, което технологията доскоро не беше в състояние да възпроизведе.
И това има значение, когато става въпрос за използване на аудио доказателства в съдебни дела.
Гласовете на заден план могат да затруднят да бъдат сигурни кой говори и какво се казва, като потенциално правят записите безполезни.
Електрическият инженер Кийт Макелвийн, основател и главен технологичен директор на Wave Sciences, се заинтересува от проблема, когато работи за правителството на САЩ по дело за военни престъпления.
Това, което се опитвахме да разберем е кой е наредил избиването на цивилни.
Някои от доказателствата включваха записи с куп гласове, всички говорещи едновременно - и това, когато научих какъв е проблемът с коктейлното парти, казва той.
Имах успех в премахването на шума като автомобилни звуци или климатици или вентилатори от речта, но когато започнах да се опитвам да премахна речта от речта, се оказа не само много труден проблем, това беше един от класическите трудни проблеми в акустиката.
Звуците подскачат около една стая и е математически ужасно да се реши.
Отговорът, казва той, е да се използва AI, за да се опита да определи и отсее всички конкурентни звуци въз основа на това откъде първоначално са дошли в една стая.
Това не означава само други хора, които могат да говорят - има и значително количество смущения от начина, по който звуците се отразяват в една стая, като гласът на целевите говорители се чува както пряко, така и косвено.
В перфектна анехоична камера - един напълно свободен от ехо - един микрофон на високоговорител би бил достатъчен, за да се разбере какво казват всички; но в истинска стая проблемът изисква микрофон и за всеки отразен звук.
Г-н Макелвийн основава Wave Sciences през 2009 г., надявайки се да разработи технология, която може да раздели припокриващите се гласове.
Първоначално фирмата използва голям брой микрофони в това, което е известно като масивно гредообразуване.
Въпреки това, обратната връзка от потенциалните търговски партньори е, че системата изисква твърде много микрофони за разходите, за да даде добри резултати в много ситуации - и изобщо не би се представила в много други.
Общият рефрен беше, че ако можем да измислим решение, което да отговори на тези опасения, те ще бъдат много заинтересовани, казва г-н Макелвийн.
И добавя: Знаехме, че трябва да има решение, защото можете да го направите само с две уши.
Компанията най-накрая реши проблема след 10 години вътрешно финансирани изследвания и подаде заявка за патент през септември 2019 г.
Това, което са измислили, е изкуствен интелект, който може да анализира как звукът отскача из стаята, преди да достигне микрофона или ухото.
Улавяме звука, когато той пристига на всеки микрофон, назад, за да разберем откъде идва, и след това, по същество, потискаме всеки звук, който не може да е дошъл от мястото, където човекът седи, казва г-н Макелвийн.
Ефектът е сравним в някои отношения с това, когато камерата се фокусира върху един обект и размива преден план и фон.
"Резултатите не звучат кристално ясно, когато можете да използвате само много шумен запис, за да се учите от него, но все пак са зашеметяващи.
Технологията има първата си реална съдебна употреба в случай на убийство в САЩ, където доказателствата, които е в състояние да предостави, се оказват централни за присъдите.
След като двама наемни убийци са арестувани за убийството на човек, ФБР иска да докаже, че са били наети от семейство, което преминава през спор за попечителство на дете.
ФБР уредило да подмамят семейството да вярва, че са били изнудвани за участието си - и след това седнали да видят реакцията.
Докато съобщенията и телефонните обаждания са били сравнително лесни за достъп за ФБР, личните срещи в два ресторанта са били различен въпрос.
Но съдът разрешил използването на алгоритъма на Wave Sciences, което означава, че аудиото се превърнало от недопустимо в основно доказателство.
Оттогава други правителствени лаборатории, включително и в Обединеното кралство, са го подложили на серия от тестове.
Сега компанията продава технологията на американските военни, които я използват за анализ на сонарните сигнали.
Също така може да има приложения в преговорите за заложници и сценариите за самоубийство, казва г-н Макелвийн, за да се увери, че и двете страни на разговора могат да бъдат чути - не само преговарящият с мегафон.
В края на миналата година компанията пусна софтуерно приложение, използващо своя учебен алгоритъм за използване от правителствени лаборатории, извършващи аудио криминалистика и акустичен анализ.
В крайна сметка тя има за цел да въведе персонализирани версии на своя продукт за използване в комплект за аудио запис, гласови интерфейси за автомобили, интелигентни високоговорители, разширена и виртуална реалност, сонар и слухови апарати.
Така например, ако говорите с колата или интелигентния си говорител, няма да има значение дали около вас има много шум, устройството все още ще може да разбере какво казвате.
AI вече се използва и в други области на криминалистиката, според съдебния педагог Тери Армента от Съдебната научна академия.
Моделите на ML [машинно обучение] анализират гласовите модели, за да определят идентичността на говорителите, процес, който е особено полезен в наказателните разследвания, където гласовите доказателства трябва да бъдат удостоверени, казва тя.
Освен това инструментите за изкуствен интелект могат да откриват манипулации или промени в аудиозаписите, осигурявайки целостта на доказателствата, представени в съда.
И AI също си пробива път и в други аспекти на аудио анализа.
Bosch има технология, наречена SoundSee, която използва алгоритми за обработка на аудио сигнали, за да анализира, например, звук от двигател, за да предвиди неизправност, преди да се случи.
Традиционните възможности за обработка на аудио сигнали нямат способността да разбират звука по начина, по който ние хората го правим, казва д-р Самарджит Дас, директор на научните изследвания и технологиите в Бош САЩ.
Аудио AI позволява по-дълбоко разбиране и семантична интерпретация на звука на нещата около нас по-добре от всякога - например, звуци от околната среда или звукови сигнали, излъчвани от машини.
По-новите тестове на алгоритъма на Wave Sciences показват, че дори само с два микрофона технологията може да работи толкова добре, колкото човешкото ухо - по-добре, когато се добавят повече микрофони.
Те разкриха и нещо друго.
Математиката във всичките ни тестове показва забележителни прилики с човешкия слух.
Има малко странности за това какво може да направи нашият алгоритъм и колко точно може да го направи, които са удивително подобни на някои от странностите, които съществуват в човешкия слух, казва Макелвийн.
Подозираме, че човешкият мозък може да използва същата математика - че при решаването на проблема с коктейлното парти, може да сме се натъкнали на това, което наистина се случва в мозъка.