доступ к аудиофайлам из облачного хранилища Google при использовании Google Speech

Question

доступ к аудиофайлам из облачного хранилища Google при использовании Google Speech

Я использовал этот бит кода ниже, чтобы успешно разобрать a .wav-файл, содержащий речь, в текст, используя Google Speech.

Но я хочу получить доступ к другому .wav файл, который я разместил в Google Cloud Storage (публично), а не на моем локальном жестком диске. Почему бы просто не изменить

speech_file = 'my/local/system/sample.wav'

К
speech_file = 'https://console.cloud.google.com/storage/browser/speech_proj_files/sample.wav'

Работать приемлемо?

Вот мой код:

speech_file = 'https://console.cloud.google.com/storage/browser/speech_proj_files/sample.wav'



DISCOVERY_URL = ('https://{api}.googleapis.com/$discovery/rest?'

                 'version={apiVersion}')





def get_speech_service():

    credentials = GoogleCredentials.get_application_default().create_scoped(

        ['https://www.googleapis.com/auth/cloud-platform'])

    http = htt|plib2.Http()

    credentials.authorize(http)



    return discovery.build(

        'speech', 'v1beta1', http=http, discoveryServiceUrl=DISCOVERY_URL)



def main(speech_file):

    """Transcribe the given audio file.



    Args:

        speech_file: the name of the audio file.

    """

    with open(speech_file, 'rb') as speech:

        speech_content = base64.b64encode(speech.read())



    service = get_speech_service()

    service_request = service.speech().syncrecognize(

        body={

            'config': {

                'encoding': 'LINEAR16',  # raw 16-bit signed LE samples

                'sampleRate': 44100,  # 16 khz

                'languageCode': 'en-US',  # a BCP-47 language tag

            },

            'audio': {

                'content': speech_content.decode('UTF-8')

                }

            })

    response = service_request.execute()

    return response

605 1

audio google-cloud-storage google-speech-api

1 ответ:

Comments

Ничего не найдено.

Brandon Yarbrough · Accepted Answer · 2017-04-22 18:13:10

Я не знаю, почему ваш подход не работает, но я хочу предложить быстрое предложение.

Google Cloud Speech API изначально поддерживает объекты облачного хранилища Google. Вместо того, чтобы загружать весь объект только для того, чтобы загрузить его обратно в Cloud Speech API, просто укажите объект, заменив эту строку:
        'audio': {
            # Remove this: 'content': speech_content.decode('UTF-8')
            'uri': 'gs://speech_proj_files/sample.wav'  # Do this!
            }
Еще одно предложение. Вы можете найти библиотекуgoogle-cloud Python более удобной в использовании. Попробуйте это:
from google.cloud import speech
speech_client = speech.Client()

audio_sample = speech_client.sample(
    content=None,
    source_uri='gs://speech_proj_files/sample.wav',
    encoding='LINEAR16',
    sample_rate_hertz= 44100)
results_list = audio_sample.sync_recognize(language_code='en-US')
Здесь есть несколько замечательных примеров: https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/speech/cloud-client