0

0

c# 如何进行语音识别

月夜之吻

月夜之吻

发布时间:2025-12-27 09:33:53

|

579人浏览过

|

来源于php中文网

原创

C#语音识别关键取决于场景、效果与联网需求:离线命令用System.Speech.Recognition(需.NET Framework+语言包),高精度在线用Microsoft.CognitiveServices.Speech SDK(需Azure密钥+区域配置),离线鲁棒识别用Whisper.Net(需手动下载模型+NAudio录音)。

c# 如何进行语音识别

C# 做语音识别,关键不在“能不能”,而在“用什么场景、要什么效果、连不联网”——选错方案,轻则识别不准、中文崩盘,重则部署失败、麦克风静音。


System.Speech.Recognition 快速跑通离线命令识别

这是 .NET Framework 自带的本地引擎,不用联网、不依赖云密钥,适合做“打开/关闭/播放”这类固定指令识别,但对自由说话、长句、口音、背景噪音容忍度极低。

  • 必须用 .NET Framework 4.7.2+(不是 .NET Core / .NET 5+),否则 SpeechRecognitionEngine 类根本不存在
  • 系统得装对应语言的语音识别语言包(例如中文需安装“中文(简体)语音识别语言包”,Windows 设置 → 时间和语言 → 语音 → 下载语言)
  • 语法必须预定义:Choices 只支持有限词表,不能直接识别任意句子;想识别自由文本,得用 DictationGrammar(),但准确率断崖式下降
  • 麦克风权限默认不弹窗,若识别无声,先检查 Windows 隐私设置 → 麦克风 → 允许此设备的应用访问麦克风
using System.Speech.Recognition;
using System;

var recognizer = new SpeechRecognitionEngine(); recognizer.SetInputToDefaultAudioDevice(); recognizer.LoadGrammar(new DictationGrammar()); // 注意:非命令模式,精度差 recognizer.SpeechRecognized += (s, e) => Console.WriteLine($"听到了:{e.Result.Text}"); recognizer.RecognizeAsync(RecognizeMode.Multiple); Console.ReadLine();


Microsoft.CognitiveServices.Speech SDK 实现高精度在线识别

这是微软官方推荐的现代方案,支持实时流式识别、多语种、标点自动恢复、说话人分离,但必须联网 + Azure 订阅密钥 + 正确区域配置,否则会卡在 Connection failed 或报错 Invalid region

  • NuGet 安装:Microsoft.CognitiveServices.Speech(注意不是过时的 Microsoft.Bing.Speech
  • SpeechConfig.FromEndpoint() 中的 URL 格式必须是 https://.stt.speech.microsoft.com/...,常见错误是把 LUIS 或 TTS 的 endpoint 粘过来
  • 中文识别需显式设置语言:speechConfig.SpeechRecognitionLanguage = "zh-CN",否则默认英文,中文输入全变乱码或空结果
  • 麦克风识别必须用 AudioConfig.FromDefaultMicrophoneInput(),别手误写成 FromFileInput —— 那是读文件,不是听你说话
var speechConfig = SpeechConfig.FromSubscription("your-key", "eastasia");
speechConfig.SpeechRecognitionLanguage = "zh-CN";
using var audioConfig = AudioConfig.FromDefaultMicrophoneInput();
using var recognizer = new SpeechRecognizer(speechConfig, audioConfig);

Console.WriteLine("请说话..."); var result = await recognizer.RecognizeOnceAsync(); Console.WriteLine($"识别结果:{result.Text}");


Whisper.Net 做真正离线、高鲁棒性的中文识别

如果你需要离线、能听清带口音/轻微噪音的日常对话(比如会议录音转文字),又不想被 Azure 配额或网络限制卡住,Whisper.Net 是目前 C# 生态里最靠谱的选择——但它不是“装完 NuGet 就能用”,模型文件得手动下载,路径一错就抛 FileNotFoundException

Felo
Felo

全球首款实现同声传译的AI翻译工具,利用先进的人工智能进行实时语音识别,实现快速、准确的翻译

下载
  • 必须同时安装两个 NuGet 包:Whisper.net 和对应平台的 Whisper.net.Runtime(如 Whisper.net.Runtime.Windows.x64
  • 模型文件(如 ggml-base-zh.bin)需从 Whisper.Net GitHub Releases 下载,放在项目输出目录(bin/Debug),并确保 new WhisperFactory().CreateBuilder().WithModelPath(...) 指向正确路径
  • 它不直接支持麦克风实时流,得用 NAudio 录一段 WAV 再喂给识别器;采样率必须为 16kHz 单声道,否则报错 Unsupported audio format
  • 首次加载模型慢(几百 MB 模型加载需数秒),别在 UI 线程直接 new,容易假死

别踩这些真实发生过的坑

很多“识别没反应”问题,其实跟语音算法无关,而是环境或权限链断裂:

  • SpeechRecognitionEngineInvalidOperationException: No recognizer of the required ID found → 系统没装语言包,或装了但没设为默认输入语言
  • SpeechRecognizer 一直卡在 Recognizing 状态不回调 → 麦克风被其他程序独占(如 Teams、Zoom),或 Windows 音频服务崩溃(可重启 Windows Audio 服务)
  • Whisper.Net 加载模型后识别全是乱码或空字符串 → 模型文件损坏,或用了英文模型(ggml-base.en.bin)强行识中文
  • 腾讯云/百度 API 返回 invalid voice format → 音频不是 16k/16bit/单声道,或 Base64 编码时丢了换行符(要用 Convert.ToBase64String(bytes, Base64FormattingOptions.None)

真正的难点从来不是写那几行识别代码,而是搞清楚你到底要让程序“听懂命令”还是“听懂人话”,再据此锁死运行环境、语言包、音频链路和错误处理边界——漏掉其中一环,整套流程就静音。

相关专题

更多
format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

616

2023.07.31

python中的format是什么意思
python中的format是什么意思

python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

426

2024.06.27

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

246

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

204

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1428

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

606

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

546

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

539

2024.04.29

虚拟号码教程汇总
虚拟号码教程汇总

本专题整合了虚拟号码接收验证码相关教程,阅读下面的文章了解更多详细操作。

25

2025.12.25

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 2.2万人学习

Git版本控制工具
Git版本控制工具

共8课时 | 1.5万人学习

Git中文开发手册
Git中文开发手册

共0课时 | 0人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号