2026/5/13 23:42:00
网站建设
项目流程
成都网站免费制作,做服装要看国外哪些网站好,网站主编 做啥,wordpress全程ssl一、转录 API
Spring AI 通过 TranscriptionModel 接口为语音转文字转录提供了统一的 API。这使您能够编写可在不同转录提供商之间移植的代码。
二、支持的提供商OpenAI 的 Whisper APIAzure OpenAI Whisper API三、通用接口
所有转录提供商都实现了以下共享接口#xff1a;
3…一、转录 APISpring AI 通过 TranscriptionModel 接口为语音转文字转录提供了统一的 API。这使您能够编写可在不同转录提供商之间移植的代码。二、支持的提供商OpenAI 的 Whisper APIAzure OpenAI Whisper API三、通用接口所有转录提供商都实现了以下共享接口3.1 TranscriptionModelTranscriptionModel 接口提供了将音频转换为文本的方法publicinterfaceTranscriptionModelextendsModelAudioTranscriptionPrompt,AudioTranscriptionResponse{/** * 转录给定提示中的音频。 */AudioTranscriptionResponsecall(AudioTranscriptionPrompttranscriptionPrompt);/** * 转录音频资源的便捷方法。 */defaultStringtranscribe(Resourceresource){AudioTranscriptionPromptpromptnewAudioTranscriptionPrompt(resource);returnthis.call(prompt).getResult().getOutput();}/** * 使用选项转录音频资源的便捷方法。 */defaultStringtranscribe(Resourceresource,AudioTranscriptionOptionsoptions){AudioTranscriptionPromptpromptnewAudioTranscriptionPrompt(resource,options);returnthis.call(prompt).getResult().getOutput();}}3.2 AudioTranscriptionPromptAudioTranscriptionPrompt 类封装了输入音频和选项ResourceaudioFilenewFileSystemResource(/path/to/audio.mp3);AudioTranscriptionPromptpromptnewAudioTranscriptionPrompt(audioFile,options);3.3 AudioTranscriptionResponseAudioTranscriptionResponse 类包含转录文本和元数据AudioTranscriptionResponseresponsemodel.call(prompt);StringtranscribedTextresponse.getResult().getOutput();AudioTranscriptionResponseMetadatametadataresponse.getMetadata();四、编写与提供商无关的代码共享转录接口的主要好处之一是能够编写无需修改即可与任何转录提供商一起工作的代码。实际的提供商OpenAI、Azure OpenAI 等由您的 Spring Boot 配置决定允许您在不更改应用程序代码的情况下切换提供商。4.1 基础服务示例共享接口允许您编写与任何转录提供商一起工作的代码ServicepublicclassTranscriptionService{privatefinalTranscriptionModeltranscriptionModel;publicTranscriptionService(TranscriptionModeltranscriptionModel){this.transcriptionModeltranscriptionModel;}publicStringtranscribeAudio(ResourceaudioFile){returntranscriptionModel.transcribe(audioFile);}publicStringtranscribeWithOptions(ResourceaudioFile,AudioTranscriptionOptionsoptions){AudioTranscriptionPromptpromptnewAudioTranscriptionPrompt(audioFile,options);AudioTranscriptionResponseresponsetranscriptionModel.call(prompt);returnresponse.getResult().getOutput();}}此服务可与 OpenAI、Azure OpenAI 或任何其他转录提供商无缝协作实际实现由您的 Spring Boot 配置决定。五、提供商特定功能虽然共享接口提供了可移植性但每个提供商也通过提供商特定的选项类例如 OpenAiAudioTranscriptionOptions、AzureOpenAiAudioTranscriptionOptions提供特定功能。这些类在实现 AudioTranscriptionOptions 接口的同时添加了提供商特定的能力。有关提供商特定功能的详细信息请参阅各个提供商的文档页面。