Google Cloud Platform Speech-to-Text API 사용법

//Google Cloud Platform Speech-to-Text API 사용법

Google Cloud Platform Speech-to-Text API 사용법

현재 4차 산업혁명 시대에서 데이터 규모가 기하급수적으로 증가하는 중에 비정형 데이터를 처리하기 위한 기술인 텍스트 마이닝의 필요성이 대두되고 있습니다. 그중 음성 데이터에서 텍스트를 추출하여 분석하는 Google Cloud Platform의 Speech-to-Text API 사용법에 대해 알아보도록 하겠습니다.

1. Google Cloud Platform Speech-to-Text API 사용 세팅

Speech-to-Text API를 사용하기 위해서는 구글 클라우드 콘솔 (https://console.cloud.google.com)에 접속하여 API 사용 설정을 하고 JSON 형식의 API 키를 발급받아야 합니다.

google cloud platform-speech-to-text-API

발급받은 API 키를 소스 내에서 불러 읽어 들이거나, 시스템 속성의 환경 변수에 등록하여 읽어 들이는 방식으로 사용하시면 됩니다.

2. 오디오 파일 준비

오디오 파일 준비에 앞서 먼저 Cloud Speech-to-Text는 음성 인식을 수행하는 세 가지 주요 방법이 있습니다.

  • 1분 이하인 짧은 오디오 파일 동기 인식

  • 최대 480분의 긴 오디오 파일 비동기 인식

  • 오디오 스트리밍 인식

평균적으로 1분 이상 길이의 오디오 파일을 사용한다고 판단하여 이 중 긴 오디오 파일 비동기 인식 방법을 사용하겠습니다. 또한, 이 API는 FLAC 또는 LINEAR16과 같은 무손실 인코딩을 권장하기에 오디오 파일은 FLAC 형식의 파일로 준비하였습니다. 만약 FLAC 형식이 아닌 MP3와 같은 파일이라면 소스 내에서 FLAC 형식으로 변환하여 사용하시는 걸 권장드립니다.

3. Google Storage에 파일 업로드

1분 이상의 오디오 파일에 대해서 Speech-to-Text API를 사용하기 위해서는 Google Storage에 파일을 업로드를 해야 가능합니다. 먼저 Storage에 버킷(Storage는 버킷 단위로 관리가 되는데 저장 공간 일종의 종류)을 생성하고 오디오 파일을 업로드합니다.

google cloud platform -Storage

4. Speech-to-Text API 실행

Google Storage에 오디오 파일 업로드까지 완료되었다면 예제 코드를 활용하여 버킷의 오디오 파일에 대해 Speech-to-Text API를 실행하시면 됩니다.

cloud-speech-to-text-API-2

5. 결과 확인

Speech-to-Text API를 실행하기 위해 유튜브에서 동영상(https://www.youtube.com/watch?v=daIGVXg7ptM)을 다운로드하여 FLAC 형식의 오디오로 변환하였습니다. Google Storage에 업로드를 하고 예제 코드를 통해 API를 실행하는 프로그램을 제작하여 결과를 확인하였습니다. 결과는 분 단위로 주어지며 실제 오디오와 비교하여 100% 정확도를 보이지는 않았지만 대충 어떤 내용이 나오는지 짐작할 수 있는 결과를 얻을 수 있었습니다. 정확한 발음의 오디오 이거나 오디오 형식에 맞게 API를 설정한다면 인식률이 올라갈 것으로 보입니다.

google cloud platform-speech-to-text-API-3

지금까지 Google Cloud Platform의 Speech-to-Text API 사용법을 살펴봤습니다. 머신러닝 기반의 음성 텍스트 변환 기능을 다양한 기능과 Mashup 해서 활용해보시기 바랍니다.

By |2020-04-21T10:46:15+00:004월 21st, 2020|Categories: 구글 애널리틱스|0 Comments

About the Author:

Leave A Comment

Big Data Social Analytics Service

소셜 빅데이터 분석 솔루션인 스마트크런처(Smart Cruncher)는 사용자 반응 지표 데이터를 수집 및 분석하여 효과적인 디지털 마케팅 실행을 위한 시장ᆞ고객분석, 홍보·마케팅 전략수립, 신사업ᆞ신상품 개발 전략 수립, VOCᆞ위기 모니터링 등의 서비스를 제공합니다.

Google Analytics Service

국내의 대기업 및 관공서는 물론 태국, 인도네시아등 해외 구축사례의 경험은골든프래닛의 노하우를 느끼실 수 있습니다. 아래의 구글 애널리틱스 기능을 통해 고객사의 요구사항에 맞는 컨설팅 업무를 진행 합니다.

Marketing Automation

골든플래닛의 디지털 마케팅이란 고객의 니즈가 발생한 시점을 정확히 알고, 고객의 니즈를 정확히 파악하여 고객이 필요로 하는 상품을 전달하는 과정이라고 할 수 있으며, 소비자들과의 커뮤니케이션을 통해 ‘고객 경로 맵(Customer Journey Map)’을 파악하는 것이 중요합니다.