доступ к аудиофайлам из облачного хранилища Google при использовании Google Speech



Я использовал этот бит кода ниже, чтобы успешно разобрать a .wav-файл, содержащий речь, в текст, используя Google Speech.



Но я хочу получить доступ к другому .wav файл, который я разместил в Google Cloud Storage (публично), а не на моем локальном жестком диске. Почему бы просто не изменить

speech_file = 'my/local/system/sample.wav'



К
speech_file = 'https://console.cloud.google.com/storage/browser/speech_proj_files/sample.wav'



Работать приемлемо?



Вот мой код:



speech_file = 'https://console.cloud.google.com/storage/browser/speech_proj_files/sample.wav'

DISCOVERY_URL = ('https://{api}.googleapis.com/$discovery/rest?'
'version={apiVersion}')


def get_speech_service():
credentials = GoogleCredentials.get_application_default().create_scoped(
['https://www.googleapis.com/auth/cloud-platform'])
http = htt|plib2.Http()
credentials.authorize(http)

return discovery.build(
'speech', 'v1beta1', http=http, discoveryServiceUrl=DISCOVERY_URL)

def main(speech_file):
"""Transcribe the given audio file.

Args:
speech_file: the name of the audio file.
"""
with open(speech_file, 'rb') as speech:
speech_content = base64.b64encode(speech.read())

service = get_speech_service()
service_request = service.speech().syncrecognize(
body={
'config': {
'encoding': 'LINEAR16', # raw 16-bit signed LE samples
'sampleRate': 44100, # 16 khz
'languageCode': 'en-US', # a BCP-47 language tag
},
'audio': {
'content': speech_content.decode('UTF-8')
}
})
response = service_request.execute()
return response
588   1  

1 ответ:

Я не знаю, почему ваш подход не работает, но я хочу предложить быстрое предложение.

Google Cloud Speech API изначально поддерживает объекты облачного хранилища Google. Вместо того, чтобы загружать весь объект только для того, чтобы загрузить его обратно в Cloud Speech API, просто укажите объект, заменив эту строку:

        'audio': {
            # Remove this: 'content': speech_content.decode('UTF-8')
            'uri': 'gs://speech_proj_files/sample.wav'  # Do this!
            }

Еще одно предложение. Вы можете найти библиотекуgoogle-cloud Python более удобной в использовании. Попробуйте это:

from google.cloud import speech
speech_client = speech.Client()

audio_sample = speech_client.sample(
    content=None,
    source_uri='gs://speech_proj_files/sample.wav',
    encoding='LINEAR16',
    sample_rate_hertz= 44100)
results_list = audio_sample.sync_recognize(language_code='en-US')

Здесь есть несколько замечательных примеров: https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/speech/cloud-client

Comments

    Ничего не найдено.