直接跳到内容

SpeechToText 语音转文本

SpeechToText组件通过封装HTML5 SpeechRecognition API控制浏览器的语音识别服务。

底层实现为panel.widgets.SpeechToText,参数基本一致,参考文档:https://panel.holoviz.org/reference/widgets/SpeechToText.html

基本用法

语音转文本组件提供了一个简单的界面来启动和停止语音识别服务,将用户的语音转换为文本。

注意:此功能是实验性的只有Chrome和少数其他浏览器支持。有关支持SpeechRecognition API的浏览器的最新列表,请参见caniuse.comMDN文档。在某些浏览器(如Chrome)中,即使支持此功能,grammarsinterim_resultsmax_alternatives参数也可能尚未实现。

在像Chrome这样的浏览器上,在网页上使用语音识别涉及基于服务器的识别引擎。您的音频会被发送到网络服务进行识别处理,因此它无法离线工作。这对您的用例来说是否足够安全和保密,需要您自行评估。

自定义按钮

可以通过设置button_typebutton_not_startedbutton_started参数来自定义按钮的外观。

连续识别

通过设置continuous=True,语音识别服务会保持打开状态,允许您连续说多个语句。

使用语法列表

可以使用GrammarList限制识别服务识别的单词或单词模式。

显示详细结果

可以通过results属性获取更详细的结果,包括置信度级别。

API

属性

属性名说明类型默认值
results识别的结果,字典列表List[Dict ][]
value最近的语音识别结果字符串str ""
lang当前语音识别服务的语言(BCP 47格式)str 'en-US'
continuous是否返回每次识别的连续结果,或仅返回单个结果boolean false
interim_results是否应返回临时结果boolean false
max_alternatives每个结果提供的最大识别替代方案数量int 1
service_uri指定当前语音识别服务使用的语音识别服务位置str 
grammars表示当前语音识别服务将理解的语法的GrammarList对象GrammarList None
started语音识别服务是否已启动boolean false
audio_started音频是否已启动boolean false
sound_started声音是否已启动boolean false
speech_started用户是否已开始说话boolean false
button_hide是否隐藏切换开始/停止按钮boolean false
button_type按钮类型str 'default'
button_not_started语音识别服务未启动时按钮上显示的文本str ''
button_started语音识别服务启动时按钮上显示的文本str ''

Events

事件名说明类型
change当识别结果改变时触发Callable 

方法

属性名说明类型
results_deserialized获取识别的结果,RecognitionResult对象列表property 
results_as_html获取格式化为HTML的结果property 

Controls

src/examples/panel_vuepy/widgets/SpeechToText

SpeechToText 语音转文本已经加载完毕