環境
ec2でUbutuたてて実施
手順
- 0.インストール
- $ sudo apt install poppler-utils
- $ sudo snap install pdftk
- $ sudo apt install zip
- $ curl "https://awscli.amazonaws.com/awscli-exe-linux-x86_64.zip" -o "awscliv2.zip"
- $ unzip awscliv2.zip
- $ sudo ./aws/install
- 1.サンプルダウンロード
- $ wget [何か適当な].pdf
- 2.1ページ目だけ抽出
- $ pdftk [何か適当な].pdf cat 1 output 1.pdf
- 3.テキスト抽出
- $ pdftotext 1.pdf 1.text
- 4.設定
- [適当にPollyFullな権限でIAMユーザ]
- $ aws configure
- AWS Access Key ID [None]: ***
- AWS Secret Access Key [None]: ***
- Default region name [somewhere]: ap-northeast-1
- Default output format [None]:[なし]
- 5.音声データ作成
- $aws polly synthesize-speech --output-format mp3 --text file://1.text --voice-id "Mizuki" 1.mp3
- $6.画像化
- $ pdftoppm -r 125 -png 1.pdf 1
- 7.ダウンロード&動画化
- 1.pdfと1.mp3をダウンロードしてPremiumProか何かで動画化