← 全部分类

语音与说话人识别

通过声纹嵌入比对录音以判断两段音频是否为同一说话人的工具,完全在设备端运行。

2 个设备端可替代方案,已排名
我们的精选
首选Free

SpeakerLens

万飞 陈

「声纹与说话人识别」品类中专注的 macOS 说话人识别工具,通过 CoreML 在设备端运行真实的 WeSpeaker ResNet293 模型,采用余弦相似度匹配。模型来源明确、支持多种音频格式、一次性买断定价,是可信度较高的选择。

新 · 暂无评分设备端
A−
总评
能力4/5
做工3/5
隐私5/5
价值5/5
优点
  • +在 Apple Silicon 上通过已知模型(WeSpeaker ResNet293)生成真实的 256 维声纹嵌入
  • +完全在设备端运行,不依赖云端,声纹数据本地存储
  • +试用后一次性买断,支持多种音频格式,7 种语言
注意事项
  • 暂无评分,实际识别精度有待验证
  • 应用场景较小众,需在 7 天试用期后购买
阅读完整评测 →
02
次选

SEIMON

Takahiro EndoFree

「声纹与说话人识别」品类中的设备端声纹对比应用,采用 MFCC/DTW/GMM 算法,界面风格独特(终端/法证分析师风)。开发者明确定位为娱乐用途、无司法效力,所用算法为经典信号处理而非现代深度模型。

新 · 暂无评分设备端
能力
做工
隐私
价值