语音输入能不能做成一个独立的节点？ #1541

WholeWorld-Timothy · 2024-05-20T09:14:17Z

例行检查

我已确认目前没有类似 features
我已确认我已升级到最新版本
我已完整查看过项目 README，已确定现有版本无法满足需求
我理解并愿意跟进此 features，协助测试和提供反馈
我理解并认可上述内容，并理解项目维护者精力有限，不遵循规则的 features 可能会被无视或直接关闭

功能描述
语音输入能不能做成一个独立的节点？
我们本地部署了一个whisper之后，发现一个问题，就是whisper的文字转译不太准确，我们想了一个办法，就是用大模型再修正一遍，这样能实现我们的需求，但是用户体验不是很好，是因为对话框中出现的仍然是未修正的词语，大模型返回了正确的答案，这显得有些怪异，能够把语音输入做成一个独立的节点，反馈到输入框的是一个修正后的答案？
应用场景
whisper的文字转译不太准确，需要经过大模型修正后，才会获得正确的文字。
相关示例
例如语音识别是今日消瘦，我们说的意思是今日销售，大模型能把今日消瘦识别出来，转换今日销售。

c121914yu · 2024-05-20T11:22:47Z

这个，直接把 whiper 模型接口，改动下也可以？

WholeWorld-Timothy · 2024-05-22T03:25:46Z

恩，也可以的，就是感觉这样是硬编程的，如果在页面上可以配置是不是会更好。

ifkd111 · 2024-05-23T08:05:02Z

这个，直接把 whiper 模型接口，改动下也可以？

大哥，怎么弄语音输入啊？我头都大了，dicker跑了个whisper 接了oneapi，一点用没有，到oneapi是通的，但是点语音输入没反应怎么弄啊

Caesar1993 · 2024-05-31T01:32:32Z

用xinference部署whisper，跟one接通了，但是fastgpt一点，就是您的浏览器不支持语音输入，也不能触发asr服务

c121914yu · 2024-05-31T04:38:15Z

这个，直接把 whiper 模型接口，改动下也可以？

大哥，怎么弄语音输入啊？我头都大了，dicker跑了个whisper 接了oneapi，一点用没有，到oneapi是通的，但是点语音输入没反应怎么弄啊

浏览器支持且有 ssl 证书

Caesar1993 · 2024-05-31T05:18:08Z

这个，直接把 whiper 模型接口，改动下也可以？

大哥，怎么弄语音输入啊？我头都大了，dicker跑了个whisper 接了oneapi，一点用没有，到oneapi是通的，但是点语音输入没反应怎么弄啊

浏览器支持且有 ssl 证书

什么浏览器支持？我用edge和chrome、safri都试了，不支持

c121914yu closed this as not planned Won't fix, can't repro, duplicate, stale May 31, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

语音输入能不能做成一个独立的节点？ #1541

语音输入能不能做成一个独立的节点？ #1541

WholeWorld-Timothy commented May 20, 2024

c121914yu commented May 20, 2024

WholeWorld-Timothy commented May 22, 2024

ifkd111 commented May 23, 2024

Caesar1993 commented May 31, 2024

c121914yu commented May 31, 2024

Caesar1993 commented May 31, 2024

语音输入能不能做成一个独立的节点？ #1541

语音输入能不能做成一个独立的节点？ #1541

Comments

WholeWorld-Timothy commented May 20, 2024

c121914yu commented May 20, 2024

WholeWorld-Timothy commented May 22, 2024

ifkd111 commented May 23, 2024

Caesar1993 commented May 31, 2024

c121914yu commented May 31, 2024

Caesar1993 commented May 31, 2024