Sie sind hier: Startseite » Forum » Hardware » Eingabe & Steuerung » Sprachsteuerung
Nächstes Thema anzeigen
Vorheriges Thema anzeigen

Vorheriges Thema anzeigenDieses Thema verschickenZeige Benutzer, die dieses Thema gesehen habenDieses Thema als Datei sichernPrintable versionEinloggen, um private Nachrichten zu lesenNächstes Thema anzeigen
Du musst dich anmelden um Beiträge zu schreiben!Du musst dich anmelden um Beiträge zu schreiben!
Autor Nachricht
Normalo
Frischfleisch
Frischfleisch


Alter: 39
Anmeldung: 29.03.2010
Beiträge: 8
Wohnort: München


BeitragVerfasst: Di 30 März, 2010 09:19  Titel:  Sprachsteuerung
Nach untenNach oben

Hallo,

bin neu hier, und dies ist mein erster Beitrag Smile

Ich bin aktuell auf der Suche nach einer Software für Linux, die Sprache in Wörter übersetzt, die sich live auf einem Device auslesen lassen. Also ich spreche, und der gesprochene Text wird z.b. auf /dev/speech2text ausgegeben, evtl. mit Satzzeichen bzw. Steuerzeichen. Zugrunde liegt natürlich ein Wörterbuch.

Meine Idee ist, dafür einen kleinen Dämon zu schreiben, der dieses Device abfrägt und per konfigurierter regulärer Ausdrücke Kommandos ausführt. Alternativ darf's auch ein Programm sein, das nach jedem gesprochenen Satz/Wort ein Skript startet, dem es den Satz/Wort übergibt. Ist dann halt nicht "live", und GUIs brauche ich auch nicht.

Leider hab ich schon vor Jahren nach sowas vergeblich gesucht. Inzwischen hat sich das anscheinend alles weiterentwickelt, aber ich hab trotzdem nichts passendes gefunden.

Kennt sich da jemand aus?



    
Gizmondo
Manchmalposter
Manchmalposter


Alter: 42
Anmeldung: 10.11.2009
Beiträge: 54
Wohnort: Weilerswist

1996 BMW 3 Series
BeitragVerfasst: Di 30 März, 2010 09:49  Titel:  (Kein Titel)
Nach untenNach oben

Erst mal Herzlich Willkommen !
Also für Windows hätt ich genau die passende lösung für dich aber Linux?! k.A.
Unter Windows hätt ich Dragon Naturaly Speaking genommen (Programm zur Sprach erkennung) in verbindung mit K.I.T.T. Talk (ein Programm das auf Sprach befehle wartet und dann .exe oder .bat oder sonstige dateien ausführt) aber unter dem Pinguin echt kein Peil.

Hardware: Foxconn 45CSX, 1GB RAM, 7" Billig Tochscreen, Navilock NL402U, M2, WD 320 GB

Software: Win 7 Prof. Centraufuse 2.0

    
Normalo
Frischfleisch
Frischfleisch


Alter: 39
Anmeldung: 29.03.2010
Beiträge: 8
Wohnort: München


BeitragVerfasst: Di 30 März, 2010 10:01  Titel:  (Kein Titel)
Nach untenNach oben

Hi und danke für die nette Aufnahme Smile

KITT Talk hab ich mir grad demonstrieren lassen. Ist aber eben beschränkt auf Kommandos. Ich brauche eher eine Diktiersoftware, die den diktierten Text auf einem lesbaren Device ausgibt. Der Sprachumfang soll nicht auf vorher trainierte Kommandos beschränkt sein.



    
Gizmondo
Manchmalposter
Manchmalposter


Alter: 42
Anmeldung: 10.11.2009
Beiträge: 54
Wohnort: Weilerswist

1996 BMW 3 Series
BeitragVerfasst: Di 30 März, 2010 10:04  Titel:  (Kein Titel)
Nach untenNach oben

dann schau dir mal das dragon an

http://www.youtube.com/watch?v=pY19BqDqlBw

Hardware: Foxconn 45CSX, 1GB RAM, 7" Billig Tochscreen, Navilock NL402U, M2, WD 320 GB

Software: Win 7 Prof. Centraufuse 2.0

    
Normalo
Frischfleisch
Frischfleisch


Alter: 39
Anmeldung: 29.03.2010
Beiträge: 8
Wohnort: München


BeitragVerfasst: Di 30 März, 2010 11:09  Titel:  (Kein Titel)
Nach untenNach oben

Vielleicht hab ich mich nicht klar ausgedrückt.

Die Software soll permanent im Hintergrund laufen (ohne GUI) und den interpretierten Text in eine Schnittstelle schreiben, z.b. Device, Socket o.ä..

Dragon tut das meines Wissens nicht.

Gibt es sowas?



    
AGM
Fingerwundschreiber
Fingerwundschreiber


Alter: 46
Anmeldung: 16.06.2008
Beiträge: 513



BeitragVerfasst: Di 30 März, 2010 11:44  Titel:  (Kein Titel)
Nach untenNach oben

Würde mich auch mal interessieren ob Dragon das kann.
Kann es auch Abfolgen von Dingen tun?
Also wenn ich zum Beispiel sage "Auflösung wechseln" dass er dann sich durch zig Fenster klickt und die Auflösung auf wasweißich ändert?



    
Normalo
Frischfleisch
Frischfleisch


Alter: 39
Anmeldung: 29.03.2010
Beiträge: 8
Wohnort: München


BeitragVerfasst: Di 30 März, 2010 12:05  Titel:  (Kein Titel)
Nach untenNach oben

@AGM: Das hat nichts mit meinem Thema zu tun.



    
Gizmondo
Manchmalposter
Manchmalposter


Alter: 42
Anmeldung: 10.11.2009
Beiträge: 54
Wohnort: Weilerswist

1996 BMW 3 Series
BeitragVerfasst: Di 30 März, 2010 12:40  Titel:  (Kein Titel)
Nach untenNach oben

@ Normalo Ok wirklich falsch verstanden und nein du hast recht das Kann Dragon nicht. Aber die integrierte Sprachsteurung von win 7 ist recht gut und kommt auch ohne GUI aus aber ob sie gleich auf eine andere schnittstelle schreiben kann weiß ich nicht.

@AGM Theoretisch kann Dragon das aber es gibt 2 möglichkeiten das zu tun
1. Du legst einen bestimten Sprachbefehl fest was dragon dann tun soll.
2. Du klickst dich selber via Sprachbefehl durch die fenster z.B. "öffne Anzeigensteuerung" "Feld Auflösung" "1024x768"

Sorry Normalo das ich das falsch verstanden habe und dir nicht helfen konnte.

Hardware: Foxconn 45CSX, 1GB RAM, 7" Billig Tochscreen, Navilock NL402U, M2, WD 320 GB

Software: Win 7 Prof. Centraufuse 2.0

    
Normalo
Frischfleisch
Frischfleisch


Alter: 39
Anmeldung: 29.03.2010
Beiträge: 8
Wohnort: München


BeitragVerfasst: Di 30 März, 2010 12:54  Titel:  (Kein Titel)
Nach untenNach oben

Kein Problem. Ich befürchte, da gibt es gar nichts auf dem Markt. Und wenn es eine annähernde Software gibt, wie z.b. julius, dann fehlen mir die zugehörigen Modelle, was auch immer ich da genau brauche.

Diese Spracherkennung ist für mich die Hauptmotivation für einen PC im Auto Smile



    
Gizmondo
Manchmalposter
Manchmalposter


Alter: 42
Anmeldung: 10.11.2009
Beiträge: 54
Wohnort: Weilerswist

1996 BMW 3 Series
BeitragVerfasst: Di 30 März, 2010 13:25  Titel:  (Kein Titel)
Nach untenNach oben

Darf ich denn fragen was du genau vor hast mit der Sprachsteuerung im CARPC? vieleicht gibts ja andere lösungsansätze.

Hardware: Foxconn 45CSX, 1GB RAM, 7" Billig Tochscreen, Navilock NL402U, M2, WD 320 GB

Software: Win 7 Prof. Centraufuse 2.0

    
Nightmare
Moderator
Moderator


Alter: 40
Anmeldung: 08.11.2005
Beiträge: 8977
Wohnort: 76855 Annweiler

1999 Citroen Xantia
BeitragVerfasst: Di 30 März, 2010 13:46  Titel:  (Kein Titel)
Nach untenNach oben

Zumal dann auch die entsprechende Audiohardware verbaut sein sollte. Mit nem 0815 Mikrofon kommst du bei den vielen Störgeräuschen im Auto nicht weit

Hardware: Joying JY-UL135N2

Software: Android 5.1.1, Sygic

    
Normalo
Frischfleisch
Frischfleisch


Alter: 39
Anmeldung: 29.03.2010
Beiträge: 8
Wohnort: München


BeitragVerfasst: Di 30 März, 2010 14:11  Titel:  (Kein Titel)
Nach untenNach oben

@Gizmondo
Mein Vorhaben beinhaltet erstmal das Steuern des Computers und externer Verbraucher, z.b. per Relaisinterface. Ich möchte auch für künstliche Intelligenz gerne eigene Routinen zum Auswerten der gesprochenen Texte basteln.

Ein Beispielszenario:
Du willst bei Wikipedia ein Wort nachschlagen. Du sprichst "Was bedeutet [Wort]?" und mein Tool schlägt bei Wikipedia nach und liest dir die Webseite vor. Während der Fahrt. Dazu musst du nichtmal die Webseite auf dem Monitor darstellen.

@Nightmare
Die Audiohardware gibt es zu kaufen. Meine Freisprecheinrichtung vom Hersteller liefert einen klaren Ton sogar bei 180 km/h. Liegt aber wohl auch an der Geräuschdämmung im Auto.



    
Gizmondo
Manchmalposter
Manchmalposter


Alter: 42
Anmeldung: 10.11.2009
Beiträge: 54
Wohnort: Weilerswist

1996 BMW 3 Series
BeitragVerfasst: Di 30 März, 2010 14:32  Titel:  (Kein Titel)
Nach untenNach oben

Entschuldige bitte wenn ich mich täusche aber genau dein beispiel szenario ist mit dragon und kitttalk unter der verwendung von texttospeech möglich. Du kannst freilich einstellen das du keine grafische beutzeroberfläche sehen wisst dann läuft das ganze im Tray. Kitt talk kannst du befehle eingeben mit variablen wie "was bedeutet ......." oder "wo bin ich" oder oder oder. Du hinterlegst dem programm wo es suchen soll z.B. wiki oder navi oder was auch immer. Dann kannst du per weiteren spraach befehl "text to speech" dir das ganze vorsagen lassen. Du musst dir nur einmal die arbeit machen alle befehle zu hinterlegen oder wie du schon schreibst ne KI schreiben die die worter in der richtigen reihenfolge interpretiert und das in kitt hinterlegen. Du kannst auch sachen wie "öffne Fahrerfenster" mit dem Programm und z.B. ner Vellman karte realisieren.

http://www.youtube.com/watch?v=cZLHFNNEq9s

Hardware: Foxconn 45CSX, 1GB RAM, 7" Billig Tochscreen, Navilock NL402U, M2, WD 320 GB

Software: Win 7 Prof. Centraufuse 2.0

    
Normalo
Frischfleisch
Frischfleisch


Alter: 39
Anmeldung: 29.03.2010
Beiträge: 8
Wohnort: München


BeitragVerfasst: Di 30 März, 2010 14:52  Titel:  (Kein Titel)
Nach untenNach oben

Du täuscht dich. Ich habe mir die Anleitung (Anleitung Downloadseite) durchgelesen. Dort gibt es keine Möglichkeit, Variablen zu definieren oder überhaupt ein externes Programm zu starten und den gesprochenen Text übergeben. Man kann lediglich Mediendateien abspielen oder Relais schalten.

Bei der Frage "Was bedeutet [Wort]" muss "[Wort]" an ein Skript übergeben werden, um die Suche bei Wikipedia nach diesem Wort zu ermöglichen.

Nach weiterer Recherche bin ich auf ein SDK gestoßen, das Nuance anbietet. So kann man die Engine erweitern. Leider nur unter Windows. Mit wine möglicherweise auch unter Linux. Leider verlangt die Software dem Rechner einiges ab, so dass bei parallelen Prozessen die Erkennung wohl nicht mehr so zeitnah funktioniert.



    
Gizmondo
Manchmalposter
Manchmalposter


Alter: 42
Anmeldung: 10.11.2009
Beiträge: 54
Wohnort: Weilerswist

1996 BMW 3 Series
BeitragVerfasst: Di 30 März, 2010 15:00  Titel:  (Kein Titel)
Nach untenNach oben

ja wie gesagt unter Linux ka kann dir hier nur mit win helfen. dragon 10 hat ein tool inbegriffen das auch externe anwendungen starten kann, kann kitt mit dem was ich von ihm will nix anfangen kümmert sich dragon drum und startet die anwendung. habs bei mir auf ner versuchs kiste so am laufen und kann bisher nicht klagen das was nicht funktioniert. Anleitung auf der Seite bezieht sich noch auf dragon 8 das meines wissens externe programme noch nicht starten konnte. Auch die eingabe konsole von dragon 10 läuft immer im tray mit das man auch dragon gezielt ansprechen kann auch wenn kitt läuft.

Aber wie gesagt alles unter win, ich weiß nicht ob wir hier ein paar linux/unix spezis haben.

Hardware: Foxconn 45CSX, 1GB RAM, 7" Billig Tochscreen, Navilock NL402U, M2, WD 320 GB

Software: Win 7 Prof. Centraufuse 2.0

    
6i6i
Stammposter
Stammposter


Alter: 36
Anmeldung: 05.12.2006
Beiträge: 254



BeitragVerfasst: Di 30 März, 2010 17:58  Titel:  (Kein Titel)
Nach untenNach oben

Schau dir mal
http://www.simon-listens.org/index.php?id=122&L=1
an.

Ist Opensource basiert auf Julius und lässt sich sicher als reine Consolenapplikation umbauen/konfigurieren.

Hardware: Atom D510, 1gb ddr2, 60gb ssd,500gb hdd, CTF800-WMSL, USB CAN Bus , Audigy2 KX, ADS, Digitus GPS

Software: WinXP Tablet PC , Destinator, cPOS (mit einigen eigenen Erweiterungen)

    
Normalo
Frischfleisch
Frischfleisch


Alter: 39
Anmeldung: 29.03.2010
Beiträge: 8
Wohnort: München


BeitragVerfasst: Di 30 März, 2010 19:08  Titel:  (Kein Titel)
Nach untenNach oben

6i6i hat folgendes geschrieben:
Schau dir mal
http://www.simon-listens.org/index.php?id=122&L=1
an.

Ist Opensource basiert auf Julius und lässt sich sicher als reine Consolenapplikation umbauen/konfigurieren.

Julius hatte ich ja bereits erwähnt in Zusammenhang mit den deutschen Akustikmodellen, die mir hier leider fehlen. Vielleicht kann man die vom Dragon verwenden Rolling Eyes



    
cyberFreak
Stammposter
Stammposter


Alter: 39
Anmeldung: 14.03.2007
Beiträge: 308
Wohnort: Vogtland

2006 BMW 1 Series
BeitragVerfasst: Do 24 Jun, 2010 19:44  Titel:  (Kein Titel)
Nach untenNach oben

für alle die ein Sprachkommando in einen Tastendruck wandeln wollen funktioniert dieses Makro einwandfrei!! (jedoch nur für Vista/7)

Hardware: Intel D510MO, 160GB 2.5"HDD, M2-ATX

Software: Win7, cAVe Live

    
Beiträge der letzten Zeit anzeigen:      
Du musst dich anmelden um Beiträge zu schreiben!Du musst dich anmelden um Beiträge zu schreiben!
Vorheriges Thema anzeigenDieses Thema verschickenZeige Benutzer, die dieses Thema gesehen habenDieses Thema als Datei sichernPrintable versionEinloggen, um private Nachrichten zu lesenNächstes Thema anzeigen

Nächstes Thema anzeigen
Vorheriges Thema anzeigen
Du kannst keine Beiträge in dieses Forum schreiben.
Du kannst auf Beiträge in diesem Forum nicht antworten.
Du kannst deine Beiträge in diesem Forum nicht bearbeiten.
Du kannst deine Beiträge in diesem Forum nicht löschen.
Du kannst an Umfragen in diesem Forum nicht mitmachen.
Du kannst Dateien in diesem Forum nicht posten
Du kannst Dateien in diesem Forum nicht herunterladen
 

CarTFT
Forenspecials



Forensicherheit - Alle Zeiten sind GMT + 1 Stunde -
Powered by phpBB2 Plus, phpBB Styles, based on phpBB © 2001/6 phpBB Group :: FI Theme ::

[ Zeit: 0.5690s ][ Queries: 48 (0.2074s) ][ GZIP Ein - Debug Ein ]
carTFT.com