Talegenkendelse

posted in: Programmering, Tips | 0

Det der med automatisk tale til tekst på en computer må nok være lidt vanskeligt – især for sådan et lille sprogområde som dansk. Om igen: Det er faktisk over 3 år siden Google lavede den første version og der skal nok være nogen brugere af Android telefoner, som betragter det som en selvfølge. (Du har i øvrigt også nogle tilsvarende muligheder på en iPhone).

Så man kan selvfølgelig undre sig over at man i 2017 kan indføre en Sundhedsplatform, som næsten får læger til at bruge mere tid på at opdatere journaler end på at se på patienter. Nå det er nu nok også lettere overdrevet, men ikke så meget, at det ikke er tilladt at undre sig.

Hvis du har en mikrofon på din PC, så kan du jo selv prøve det af på google.dk (klik på mikrofonen i søgefeltet) eller ved at gå ind på denne hjemmeside (det skal være med Google Chrome eller Mozilla Firefox – Internet Explorer kan ikke): dictation.io

Ud over at det er nærmest gratis tilgængeligt fra Google findes der også flere forskellige kommercielle programmer, fx Dictus

Her er mere information om, hvordan man selv kan udnytte Googles løsning: labnol.org add-speech-recognition-to-website

Stemmegenkendelse er egentligt kun en del af opgaven, hvis det skal bruges i forbindelse med et it system – det er også nødvendigt at genkende konteksten og det er nok grunden til at det første område, hvor stemmegenkendelse blev taget i brug, var til “kommandoer”: Hvis det modtagende system ved at konteksten er “start et program” så skal det talte kun genkendes som et programnavn. Men da selve oversættelsen fra tale til tekst efterhånden er så god, som den er, så er det relativt overkommeligt, at kombinere kommandoer med inddatering – selv om det selvfølgelig kræver nogen enighed om syntax. Hvis al tale, der begynder med “Gå til” opfattes som en kommando, så er systemet nok ikke så anvendligt for en vandreforening.

Hvis du er blevet mere interesseret, kan du her se en oversigt over DTU forskningsrapporter på området: www.act.elektro.dtu.dk dtupublication voice recognition

Opdatering 15.1 2018: Internet markedsføring bruger ikke altid så fine metoder. Så nu (eller om få minutter) kan man også få en hjemmesidetilføjelse, der kan lave transcripering af en youtube video, så din “helt egen” blog hurtigt kan få omfangsrigt indhold. Og teknikken ser ud til at være stort set den samme som jeg har beskrevet ovenfor. Så forestil dig nu at videoen i virkeligheden er et interview, en tale, et journaldiktat…. – så begynder det at ligne noget. Du kan se mere om videotranscripering her: Blooom