如何用javascript实现语音识别功能_web speech api的兼容性如何

狼影

发布时间：2026-01-09 15:42:09

428人浏览过

来源于php中文网

原创

SpeechRecognition 在主流浏览器中基本不可用，仅 Chrome 稳定支持且限 HTTPS；Firefox、Safari、Edge 均未实现，W3C 规范仍为草案；应通过实例化并监听事件检测可用性，而非仅判断构造函数存在。

如何用javascript实现语音识别功能_web speech api的兼容性如何

Web Speech API 的 `SpeechRecognition` 在主流浏览器中基本不可用

Chrome 是目前唯一稳定支持 SpeechRecognition（即语音识别）的桌面浏览器，且仅限 HTTPS 环境；Firefox、Safari、Edge（Chromium 之外）均未实现该接口，调用 webkitSpeechRecognition 会直接报 ReferenceError 或返回 undefined。这不是配置或权限问题，而是标准未被采纳——W3C 规范仍处于「Working Draft」阶段，厂商支持意愿极低。

检测 `SpeechRecognition` 是否可用的正确方式

不能只靠 typeof window.SpeechRecognition !== 'undefined'，因为 Chrome 以外的浏览器可能暴露构造函数但无法实例化。必须尝试创建并监听事件是否触发：

function isSpeechRecognitionAvailable() {
  const SpeechRecognition = window.SpeechRecognition || window.webkitSpeechRecognition;
  if (!SpeechRecognition) return false;

  try {
    const rec = new SpeechRecognition();
    // Chrome 会立即触发 onstart（即使未调用 start()），其他浏览器通常抛错或静默失败
    let started = false;
    rec.onstart = () => { started = true; };
    rec.onerror = () => { started = false; };
    rec.start(); // 触发权限请求和初始化
    setTimeout(() => {
      rec.stop();
      return started;
    }, 500);
  } catch (e) {
    return false;
  }
}

实际项目中建议直接用特征检测 + 降级提示，例如：

检测失败时显示「语音输入仅支持 Chrome 浏览器」
避免在非 Chrome 环境中调用 rec.start()，否则可能引发未捕获异常
移动端 iOS Safari 完全不支持，Android Chrome 支持但需手动开启麦克风权限

替代方案：用 WebRTC + 第三方 ASR 服务绕过浏览器限制

真正跨浏览器可用的语音识别，得放弃 SpeechRecognition，改用 MediaRecorder 录制音频流，再上传至 ASR 服务（如 Whisper.cpp、Azure Speech、AWS Transcribe）：

CG Faces

免费的 AI 人物图像素材网站

下载

立即学习“Java免费学习笔记（深入）”；

MediaRecorder 兼容性好（Chrome/Firefox/Safari/Edge 均支持）
录制后转成 Blob 或 ArrayBuffer，通过 fetch 发送到你自己的 ASR 中转接口
避免前端直连第三方 API 密钥泄露风险
延迟比原生 API 高 1–2 秒，但准确率和语言支持远超 SpeechRecognition

关键代码片段（仅录音部分）：

async function startRecording() {
  const stream = await navigator.mediaDevices.getUserMedia({ audio: true });
  const mediaRecorder = new MediaRecorder(stream);
  const chunks = [];

  mediaRecorder.ondataavailable = e => chunks.push(e.data);
  mediaRecorder.onstop = async () => {
    const blob = new Blob(chunks, { type: 'audio/webm' });
    // 后续上传 blob 到你的 ASR 接口
  };

  mediaRecorder.start();
  return { stop: () => mediaRecorder.stop(), stream };
}

Chrome 下使用 `SpeechRecognition` 的几个硬坑

即便在 Chrome 中，也容易因细节翻车：

必须是 HTTPS 页面（localhost 除外），HTTP 页面会静默禁用
interimResults: true 时，result[0][0].transcript 可能频繁重写，需用 event.results[i][0].isFinal 判断是否最终结果
连续识别需手动调用 rec.start()，但 Chrome 会在识别结束约 5 秒后自动停止，需监听 onend 并重新 start()
lang 参数必须严格匹配 BCP 47 标签（如 'zh-CN'，不是 'zh' 或 'Chinese'），否则 fallback 到英文
移动端 Chrome 会强制弹出系统麦克风权限框，且无法预授权；用户拒绝后，后续调用 start() 会直接触发 onerror 且 error.code === 'not-allowed'

Chrome 的 SpeechRecognition 不是“能用就行”的功能，而是“只在特定条件组合下才勉强可用”的实验性接口。真实项目里，优先考虑 WebRTC + 后端 ASR 的组合，兼容性和可控性高得多。

如何使用 JavaScript 判断指定日期是否超过当前日期一年

如何用 JavaScript 判断指定日期是否超过当前日期一年

为什么学习javascript_它在前端开发中扮演什么角色

javascript Symbol类型_怎样创建唯一标识

Javascript中的解构赋值如何简化代码书写？

java速学教程(入门到精通)

java怎么学习？java怎么入门？java在哪学？java怎么学才快？不用担心，这里为大家提供了java速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：GitHub 公共仓库不会导致他人擅自部署到你的页面下一篇：javascript高阶函数是什么_它有哪些实际应用场景？

作者最新文章

javascript是什么_它如何改变网页交互体验？

2026-01-09 14:23

Yandex俄罗斯搜索首页免登录访问无需账户直接进入官方入口

2026-01-09 14:31

长江雨课堂网页版入口_长江雨课堂统一身份认证登录平台

2026-01-09 14:34

中国电信保号套餐怎么办_电信保号套餐办理

2026-01-09 14:35

今日头条app的免费小说频道在哪_今日头条免费小说入口查找方法

2026-01-09 14:54

javascript的服务端渲染是什么_与传统渲染有何不同

2026-01-09 14:55

今日头条里的免费小说在哪看_番茄小说频道入口查找教程

2026-01-09 14:58

2026学习通最新登录入口_官方平台网页版安全访问方式

2026-01-09 14:58

如何操作Canvas_JavaScript中Canvas绘图的基本步骤是什么

2026-01-09 15:34

如何用javascript实现语音识别功能_web speech api的兼容性如何

2026-01-09 15:42

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

js获取数组长度的方法

在js中，可以利用array对象的length属性来获取数组长度，该属性可设置或返回数组中元素的数目，只需要使用“array.length”语句即可返回表示数组对象的元素个数的数值，也就是长度值。php中文网还提供JavaScript数组的相关下载、相关课程等内容，供大家免费下载使用。

548

2023.06.20

js刷新当前页面

js刷新当前页面的方法：1、reload方法，该方法强迫浏览器刷新当前页面，语法为“location.reload([bForceGet]) ”；2、replace方法，该方法通过指定URL替换当前缓存在历史里（客户端）的项目，因此当使用replace方法之后，不能通过“前进”和“后退”来访问已经被替换的URL，语法为“location.replace(URL) ”。php中文网为大家带来了js刷新当前页面的相关知识、以及相关文章等内容

373

2023.07.04

js四舍五入

js四舍五入的方法：1、tofixed方法，可把 Number 四舍五入为指定小数位数的数字；2、round() 方法，可把一个数字舍入为最接近的整数。php中文网为大家带来了js四舍五入的相关知识、以及相关文章等内容

730

2023.07.04

js删除节点的方法

js删除节点的方法有：1、removeChild()方法，用于从父节点中移除指定的子节点，它需要两个参数，第一个参数是要删除的子节点，第二个参数是父节点；2、parentNode.removeChild()方法，可以直接通过父节点调用来删除子节点；3、remove()方法，可以直接删除节点，而无需指定父节点；4、innerHTML属性，用于删除节点的内容。

475

2023.09.01

JavaScript转义字符

JavaScript中的转义字符是反斜杠和引号，可以在字符串中表示特殊字符或改变字符的含义。本专题为大家提供转义字符相关的文章、下载、课程内容，供大家免费下载体验。

394

2023.09.04

js生成随机数的方法

js生成随机数的方法有：1、使用random函数生成0-1之间的随机数；2、使用random函数和特定范围来生成随机整数；3、使用random函数和round函数生成0-99之间的随机整数；4、使用random函数和其他函数生成更复杂的随机数；5、使用random函数和其他函数生成范围内的随机小数；6、使用random函数和其他函数生成范围内的随机整数或小数。

990

2023.09.04

如何启用JavaScript

JavaScript启用方法有内联脚本、内部脚本、外部脚本和异步加载。详细介绍：1、内联脚本是将JavaScript代码直接嵌入到HTML标签中；2、内部脚本是将JavaScript代码放置在HTML文件的`<script>`标签中；3、外部脚本是将JavaScript代码放置在一个独立的文件；4、外部脚本是将JavaScript代码放置在一个独立的文件。

656

2023.09.12

Js中Symbol类详解

javascript中的Symbol数据类型是一种基本数据类型，用于表示独一无二的值。Symbol的特点：1、独一无二，每个Symbol值都是唯一的，不会与其他任何值相等；2、不可变性，Symbol值一旦创建，就不能修改或者重新赋值；3、隐藏性，Symbol值不会被隐式转换为其他类型；4、无法枚举，Symbol值作为对象的属性名时，默认是不可枚举的。

551

2023.09.20