集成阿里云的实时语音识别遇到的问题:
困扰了一周时间,主要涉及到流的处理问题。
集成是通过引用maven依赖加载。
前端录音通过流的方式传到后端,后端再把流上传到Minio,后端拿到文件地址,调微服务(集成语音识别的是另一个独立的微服务)去Minio获取输入流,再上传到阿里云(公有云的服务)。然后监听返回识别的结果,最后返回结果文本给前端。
偶发性,,监听不到返回的结果就关闭了服务端。该音频是正常的,拿去官网下载的demo执行,是有监听到返回的结果。这时就很纳闷,多数在我集成的代码里是可以监听到结果的,少数没有监听到,一开始以为是音频问题,所以就去demo执行,验证音频,是没问题的。
最后叫同事一起帮忙对比代码debug,终于发现了,demo里切片上传的是文件输入流,但我的是直接上传的是从Minio获取到的输入流,,,重点是文件输入流和单单的输入流是有区别的。因为是偶发性,一直没留意这里。
InputStream不可以读取文件,它是一个抽象类,根本不可能实例化,是所有输入流的基类。而FileInputStream是InputStream的一个实现类,用于读取诸如图像数据之类的原始字节流。FileInputStream是读取一个文件来作InputStream,FileInputStream是字节流。
-
- //获取文件名
- String fileName = path.substring(path.lastIndexOf("/"));
- InputStream fis = MinioUtil.getMinioFile(MinioUtil.getBucketName(), fileName);
-
-
- byte[] b = new byte[6400];
- int len;
- while ((len = fis.read(b)) > 0) {
- logger.info("send data pack length: " + len);
- recognizer.send(b, len);
- // 8000采样率情况下,3200byte字节建议 sleep 200ms,16000采样率情况下,3200byte字节建议 sleep 100ms
- int deltaSleep = getSleepDelta(len, 8000);
-
- }
-
- //获取文件名
- String fileName = path.substring(path.lastIndexOf("/"));
- InputStream fis2 = MinioUtil.getMinioFile(MinioUtil.getBucketName(), fileName);
- //创建临时文件
- File file = File.createTempFile(IdWorker.getIdStr(),"");
- FileUtil.writeFromStream(fis2,file);
- FileInputStream fis = new FileInputStream(file);
-
- byte[] b = new byte[6400];
- int len;
- while ((len = fis.read(b)) > 0) {
- logger.info("send data pack length: " + len);
- transcriber.send(b, len);
- // 8000采样率情况下,3200byte字节建议 sleep 200ms,16000采样率情况下,3200byte字节建议 sleep 100ms
- int deltaSleep = getSleepDelta(len, 16000);
-
- }