發表文章

目前顯示的是有「STT」標籤的文章

IT|軟體|應用|語音辨識|即時說話口譯 DIY-2 搭配 RESTFul API 應用

圖片
系統相關環境設定請參考以下幾篇資料: IT|軟體|應用|語音辨識|即時說話口譯DIY-1 基本應用 IT|軟體|應用|使用Flask實現一個RESTful API Service in 樹莓派 IoT|硬體|樹莓派|外接麥克風及喇叭設置 [接線] 3.3(必須 3.3v) 3.3 11(BCM 17) 電阻 3(GND) 接地 rec.py #!/usr/bin/env python3 # -*- coding: utf-8 -*- import RPi.GPIO as GPIO import pyaudio import wave import os import sys def rec_fun():     # 隱藏錯誤消息,因為會有一堆 ALSA 和 JACK 錯誤消息,但其實能正常錄音     os.close(sys.stderr.fileno())         BUTT = 17    # 開始錄音的按鈕:一邊接 GPIO17 ,一邊接地     GPIO.setmode(GPIO.BCM)     # 設 GPIO26 腳為輸入腳,電平拉高,也就是說 26 腳一旦讀到低電平,說明按了按鈕     GPIO.setup(BUTT, GPIO.IN , pull_up_down = GPIO.PUD_UP)     # wav 文件是由若干個 CHUNK 組成的, CHUNK 我們就理解成數據包或者數據片段。     CHUNK = 512     FORMAT = pyaudio.paInt16  # pyaudio.paInt16 表示我們使用量化位數 16 位來進行錄音     RATE = 4410...

IT|軟體|應用|語音辨識|即時說話口譯 DIY-1 基本應用

本翻譯機器人的完整程式碼放置於 https://github.com/ch-tseng/Translate-Bot [材料準備] 1. 樹莓派主板 x 1(Raspberry Pi 3 Model B) 2. 揚聲器0.5w x 1 3. 3.5"音源線  x 1 4. 3.5"麥克風 x 1 6.音效卡 因為樹莓派沒有內建mic輸入,所以要使用 STT 功能,首先要先在樹莓派上裝一支麥克風,有兩種方式可以替樹莓派裝上麥克風,相關麥克風設定,請參考以下記事鏈結。-->  IoT|硬體|樹莓派|外接麥克風及喇叭設置 [更新系統] 首先是更新軟體套件的清單: sudo apt-get update 然後更新軟體套件本身(也可以用dist-upgrade): sudo apt-get upgrade 若想更新韌體部分,指令如下(若擔心的話,請事先備份整張記憶卡): sudo rpi-update 完成後,重開機: sudo reboot [安裝軟體] SpeechRecognition :它將一些常用的 speech recognition 系統整合在一起,方便我們使用,可省下相當多的開發時間。該模組整合了下列知名的STT API: 1. CMU Sphinx (works offline) 2. Google Speech Recognition 3. Wit.ai 4. Microsoft Bing Voice Recognition 5. api.ai 6. IBM Speech to Text 安裝 Python3 SpeechRecognition 模組 sudo pip3 install SpeechRecognition TextBlob :這是一套強大的文本分析工具,提供了方便的工具進行詞性分類、名詞短語截取、情感分析、文本分類、拼寫檢查、翻譯和語言檢測…等等,未來我們再針對此模組作深入的使用,在這裏我們將僅使用它的翻譯功能(透過Google API) 安裝 TextBlob 安裝 TextBlob sudo pi...