Go教程

哪个更快:OpenAI Whisper、Google TTS 还是 Piper TTS??

本文主要是介绍哪个更快:OpenAI Whisper、Google TTS 还是 Piper TTS??,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

我必须承认我错了。

切换 ChatGPT 版本并不是解决我的 DIY Jarvis 延迟问题的方法。在之前的邮件中,我展示了如何将 GPT-3 和 GPT-4 进行对比测试。尽管 GPT-3 更快,但它并没有解决问题,因为它只快了一秒钟。

具体是什么问题?

问题是我在说话时结束句子与贾维斯开始回应之间需要缩短延迟,目前这个延迟大约是6秒。

想象一下你问我一个问题,然后是一段尴尬的沉默,接着是一个延迟的回答。这种情况真的会破坏对话体验。这就是所谓的响应延迟。

更多调试表明问题其实出在 OpenAI Whisper。

OpenAI Whisper 是一个开源的自动语音识别系统,设计用于准确地转录多种语言的语音。

在 Jarvis 的上下文中,它充当系统的耳朵。它让 Jarvis 能够理解语音命令和查询。

在确定问题是由于 OpenAI Whisper 引起的之后,我接下来做了什么?

我又做了一些测试!这次我比较了 OpenAI Whisper、Google TTS 和 Piper TTS。

了解更多关于Iron Man ChatGPT Jarvis课程的信息。

在运行测试之前,我预计本地运行的Piper TTS会是最快的。结果很快证明我是对的,但Piper TTS的低质量仍然影响了Jarvis的性能。我知道必须有一种更好的方法来解决这个问题。

经过多次尝试和错误之后,解决延迟问题的最终方案是什么?

我了解到使用OpenAI Whisper是最好的选择,因为它提供了最佳的结果。而且,我通过一种称为Sequential Sentence Chunking(序列句子分块)的技术解决了延迟问题!

Sequential Sentence Chunking 是一个将文本分解成更小、更易管理的片段以便更轻松地分析的过程。这一技术使我们成功地将响应延迟从6秒降低到了1秒!

想知道我是如何实现这个解决方案的吗?

在我们的《钢铁侠ChatGPT Jarvis课程》中,我们将向您展示Sequential Sentence Chunking是如何工作的,并教您如何在代码中实现它,以将您的响应延迟提高6倍!

该课程详细地展示了创建你自己的Jarvis所需的每一个步骤。课程包括以下模块:

  • 模块 1:介绍和项目概览 — 解释项目的目標、所需组件和潜在应用。
  • 模块 2:硬件设置 — 介绍如何组装和连接贾维斯头盔的硬件组件。
  • 模块 3:软件配置 — 如何设置树莓派,安装必要的软件,并编写语音识别、聊天机器人功能、头盔控制和系统集成的脚本。
  • 模块 4:未来潜力和结论 — 探讨未来的改进,并提供继续学习和分享项目的资源。

释放你内心的钢铁侠,今天仅需69美元就能打造你自己的DIY Jarvis。

不要错过。今天的特别优惠仅此一天。名额很快就会被抢光,而且明天价格会上涨。

🚨价格将于明天上涨10美元!!

报名参加Iron Man ChatGPT Jarvis课程。

等等,这还不是全部。

如果你已经报名参加了Augmented AI大学的Iron Man ChatGPT Jarvis课程,那么该课程已经包含在你的订阅中了。

Augmented AI University 是什么?

Augmented AI University 是一个很好的资源,可以学习与人工智能相关的所有内容。

Augmented AI 大学是为任何对人工智能好奇并希望亲自动手实践的人创建的。

Augmented AI大学涵盖了从人工智能在农业和股市中的应用到最新自动驾驶汽车和物体识别技术的方方面面。

了解更多关于Augmented AI大学的信息

考虑一下自制版的Jarvis能为你打开的大门。人工智能世界中的机会是无穷无尽的。

这是我们一位参加过我们其他课程的学生的评价:

这篇关于哪个更快:OpenAI Whisper、Google TTS 还是 Piper TTS??的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!