Существуют ли какие-либо (бесплатные) API-интерфейсы речи для текста, которые я мог бы использовать с PHP? (Я знаю только PHP и html / css.)
Я хотел бы отправить ему аудиофайл, а затем вернуть его транскрипцию.
Я не нашел никаких бесплатных API, но есть несколько относительно недорогих:
Первые два позволяют вам поставлять MP3, тогда как Twilio (который имеет лучшие тарифы) получает вход через свою собственную систему, поэтому ваш выбор будет зависеть от вашего приложения.
(Вам придется использовать Google PhoneTag и Twilio, я не могу опубликовать более одной ссылки по моей текущей репутации.)
Распознавание голоса является довольно дорогостоящим вычислением – это не тот проект, который вы бы использовали с помощью PHP-OTOH, вы можете создать веб-интерфейс или интегрироваться в приложение типа Web / IVR с использованием PHP в качестве клей (голосовой поиск на Android очень круто).
Поэтому, несмотря на наличие готовых наборов инструментов , вы, вероятно, собираетесь писать много кода на C, чтобы делать с ними что-нибудь интересное. И то, как вы получаете, сильно зависит от используемой ОС (не указано – например, ссылка на первый хит из Google).
Dynaspeak из SRI мог бы работать.