Laboratorium technologii mowy wychodzi na światowe rynki

  Go Global – to nazwa programu NCBR, dzięki któremu najbardziej innowacyjne polskie firmy, często założone lub wspierane przez naukowców, wychodzą ze swoją ofertą na światowy rynek.

  Taką szansę otrzyma w październiku Voicelab, spółka wdrażająca technologie bankowości głosowej oraz autorskie rozwiązania dla telekomunikacji i medycyny. W jej radzie naukowej zasiadają badacze z Politechniki Gdańskiej, a także zagraniczni uczeni.
   
  Firma prowadzi m.in. projekt „Technologie rozpoznawania mowy ciągłej, odszumiania mowy oraz biometrii” i jest beneficjentem programu „Go_Global.pl”. Współpracuje jednocześnie z uczelniami, instytucjami publicznymi i z przemysłem. Młodych przedsiębiorców, inżynierów dźwięku wspierają naukowcy z Politechniki Gdańskiej: prof. Maciej Niedźwiecki z Katedry Systemów Automatyki i dr Jan Daciuk z Katedry Inteligentnych Systemów Interaktywnych.
   
  Zdaniem prezesa Voicelab Tomasza Szwelnika, założycielom spółki i ich doradcom naukowym udało się zatrzeć granicę między innowacyjnym przedsiębiorstwem a laboratorium, które to słowo znajduje się w nazwie Voicelab.
   
  „Jesteśmy absolwentami Politechniki Gdańskiej – po specjalności inżynieria dźwięku. Stąd nasze zainteresowanie przetwarzaniem sygnałów mowy i technologią rozpoznawania mowy. Od początku to zjawisko nas fascynowało – wspomina rozmówca PAP. – W 2009 r. w wyniku konkursu Innowator, który był organizowany przez Fundację na rzecz Nauki Polskiej założyliśmy razem z Marcinem Kuropatwińskim firmę, która rozpoczęła badania i przygotowanie technologii rozpoznawania i odszumiania sygnałów mowy.”
   
  Inżynierom dźwięku potrzebne były środki na rozwój firmy. Wzięli zatem udział w projekcie unijnym finansowanym z PARP, który pozwolił im rozwijać innowacyjne produkty. W 2012 w prace badawczo-wdrożeniowe zainwestował Jacek Kawalec – znany jako współzałożyciel WP i inwestor wielu innowacyjnych przedsięwzięć. Więcej na temat poszczególnych wdrożeń w serwisie Nauka w Polsce tutaj.
   
  Technologia rozpoznawania mowy zdobyła uznanie ekspertów zagranicznych, którzy dołączyli do tworzonej przez firmę rady naukowej. Zasiada w niej m.in. prof. Bastiaan Kleijn, założyciel Global IP Solutions, obecnie pracujący w Nowej Zelandii w School of Engineering and Computer Science in Victoria. Kolejnym doradcą spółki jest prof. Reinhold Haeb-Umbach, znany z pracy nad rozpoznawaniem mowy dla Philips Laboratories, obecnie kierujący Grupą Multimedia na Uniwersytecie Paderborn w Niemczech.
   
  „Krok po kroku opracowaliśmy własną technologię, którą możemy dowolnie dostosowywać do potrzeb naszych klientów. Prowadzimy wdrożenia. Interesujemy się nowościami, opracowujemy nasze rozwiązania do patentu czy przedstawiamy je na targach wynalazczości. Planujemy działać na rynku światowym” – mówi Szwelnik.
   
  Firma Voicelab koncentruje się na nowatorskim podejściu do tworzenia modelu akustycznego w oparciu o bardzo duże zbiory danych. Systemy mają działać na urządzeniach przenośnych – w telefonach komórkowych, laptopach, tabletach, a nawet w ekspresach do kawy, pralkach, lodówkach, którymi można będzie sterować głosem, w tym w zabawkach igrach. „Nie znamy jeszcze nowych produktów, w których ta przyszłościowa technologia będzie miała zastosowanie. Jedziemy do Doliny Krzemowej właśnie po to, żeby szukać nowych nisz, zainteresować partnerów, zaistnieć na rynku światowym i wrócić do kraju bogatsi o nowe pomysły i kontakty” – zapowiada Szwelnik.

  Czy to naukowa brawura, by szukać swojego miejsca w branży, którą okupują światowi giganci? Prezes Voicelab jest przekonany, że znajdzie się tu nisza również dla polskiej technologii.
   
  „Technologia rozpoznawania mowy należy do jednych z najbardziej zaawansowanych technologii na świecie i jest pełna wyzwań. Od lat 60. człowiek interesuje się rozpoznawaniem mowy, począwszy od badań w Bell Labs, badań prowadzonych przez IBM, Microsoft i przez inne instytuty badawcze na świecie. Do dziś jednym z większych wyzwań jest, by mowa ludzka była rozpoznawana na poziomie zdolności człowieka, a nawet była rozumiana przez komputer. My takie wyzwanie podjęliśmy” – mówi inżynier dźwięku.
   
  Jego wspólnik, Marcin Kuropatwiński – lider technologiczny Voicelab, prezentował rozwiązania firmy na międzynarodowej konferencji International Conference on Acoustics, Speech, and Signal Processing (ICASSP). Był jednym z sześciu Polaków na tej konferencji, obok ok. 1000 naukowców z Ameryki i ok. 400 z Niemiec.
   
  „Mamy silną bazę naukową. Jesteśmy dumni z tego, że w małej polskiej firmie powstała technologia światowej rangi. Mamy szansę na wprowadzenie jej na rynki światowe dzięki programowi Go Global prowadzonemu przez NCBiR. Środki z tego programu (ok. 200 tys. zł) pozwolą nam w październiku pojechać do Doliny Krzemowej i tam zaprezentować nasze wszystkie technologie” – ocenia Szwelnik.
   
  Zdradza, że jego firma planuje implementację w systemie kolejnych języków – niemieckiego, angielskiego, hiszpańskiego i rosyjskiego. „W dzisiejszych czasach nie każda firma chce zamawiać usługi u globalnych koncernów. Nasze podejście do klientów jest indywidualne i elastyczne. A miejsce na rynku jest dla wszystkich. Według prognoz rynek ten będzie się rozwijał jeszcze przez kilka lat ze współczynnikiem wzrostu ok. 20 proc. co roku” – szacuje prezes Voicelab.
   
  System rozpoznawania mowy Voicelab otrzymał złoty medal na targach wynalazczości INPEX w USA, srebrny medal na targach w Belgii oraz brązowy w Tajwanie. Na drodze do optymalnej komunikacji głosowej stanąć mogą m.in. hałas, szum czy inne dźwięki zewnętrzne. Rozwiązaniem tych problemów ma być system odszumiania Noisebusters. Początki rozwoju technologii tkwią we własnych badaniach Voicelab oraz wsparciu ze środków funduszy unijnych oraz środków prywatnych. Również ta technologia otrzymała złoty medal na targach INPEX.
   
  Firma bierze też udział w projektach badawczo-rozwojowych wykorzystujących możliwości biometrii głosowej. NCBiR finansuje projekt na rzecz bezpieczeństwa i obronności państwa pt. „Opracowanie systemu informatycznego umożliwiającego identyfikację głosową osób dzwoniących pod numer alarmowy”. Liderem konsorcjum jest Akademia Górniczo-Hutnicza.
   
  „Jest to nowa technologia, która w przyszłości miałaby zastosowanie do identyfikacji osób podejrzanych o wprowadzanie w błąd służby alarmowe. Chodzi np. o osoby dzwoniące kolejny raz w sprawie podłożenia bomby. System głosowy ma te osoby identyfikować, określać ich profil psychologiczny, wiek, płeć, fakt bycia pod wpływem środków odurzających. Dzięki temu projektowi mamy szansę na współpracę technologiczną i rozwijanie własnych technologii” – tłumaczy Szwelnik. Projekt prowadzony jest od zeszłego roku i potrwa jeszcze 2 lata. Całkowity koszt jego realizacji przekracza 1,5 mln zł. Projektem opiekuje się prof. Mariusz Ziółko z AGH.