Google Cloud Platform Japan Blog
最新情報や使い方、チュートリアル、国内外の事例やイベントについてお伝えします。
ラーメン二郎とブランド品で AutoML Vision の認識性能を試す
2018年3月27日火曜日
この投稿は米国時間 3 月 26 日に投稿されたもの(投稿は
こちら
)の抄訳です。
Posted by Google Cloud デベロッパー アドボケイト 佐藤一憲
この 3 つのラーメンは、41 店舗ある
ラーメン二郎
のうち 3 店舗で作られたものです。それぞれ、どの店舗で出されたものか分かりますか? データ サイエンティストの
土井賢治
さんが作成した機械学習(ML)によるラーメン識別器を使えば、それぞれの微妙な盛り付けの違いを見分けることで、
95%
の精度で店舗を特定できます。
ラーメン二郎の 3 つの店舗で作られたラーメン
この写真を見ても分かるとおり、ラーメン二郎の相当コアなファンでもなければ、ラーメン画像から 41 店舗のどこで作られたかを見分けることは簡単ではありません。テーブルやどんぶりの色、形にあまり違いのない場合が多いのです。
土井さんは、ディープ ラーニングを使ってこの問題を解けるか興味を持ち、インターネット上から 48,244 枚のラーメン二郎画像を集めました。ML モデルの学習に合わない画像(重複したもの、どんぶりが写ってないもの等)を取り除いたあと、1,170 枚 × 41 店舗 = 約 48,000 枚の画像とそれぞれの店舗ラベルを用意しました。
AutoML Vision で 94.5% の精度を達成
そして土井さんは、今年 1 月、Google が
AutoML Vision
のアルファ版を公開したことを知りました。
AutoML Vision は、ML の知識のない方でも、任意の画像を用いて ML モデルの学習を簡単に行えるサービスです。学習用の画像ファイルとラベルをアップロードするだけで、学習を開始できます。学習が終わったら、その ML モデルをスケーラブルなプラットフォーム上で簡単に運用できます。このすべての手順を、データ サイエンティストや ML 専門家の知識なしで進められます。
AutoML Vision
によるカスタム ML モデルの学習、デプロイ、運用
土井さんは AutoML Vision のアルファ版に申し込み、さっそくラーメン二郎画像でその性能を試してみました。上述の 48,000 枚の画像で学習したところ、
94.5%
の精度(94.8% precision、94.5% recall)がすぐさま得られました。
AutoML Vision(Advanced モード)によるラーメン二郎店舗識別の混同行列
(各行は実際の店舗、各列は予測された店舗)
上記の
混同行列
を見ると、AutoML Vision がそれぞれのテスト ケースでごくわずかな間違いししか起こしていないことがわかります。
なぜディープ ラーニングはここまで高い精度で店舗を見分けられるのでしょうか? 個々の写真にどのような違いがあるのでしょう? 土井さんは当初、テーブルやどんぶりの色や形の違いを ML モデルが見ているのでは、と考えました。しかし冒頭の写真例のように、テーブルとどんぶりがまったく同じ場合でも高精度で識別できます。おそらくは、店舗ごとの盛り付け方や肉の切り方の微妙な違いを見分けているのでは、と彼は考えています。
データ サイエンティストの技を自動化
AutoML Vision を試すまで、土井さんは自分で設計した ML モデルを用いてラーメン識別器を開発していました。様々な試行錯誤の結果、Inception、ResNet、そして SE-ResNeXt を組み合わせた
アンサンブル モデル
を作成し、精度を上げるための
データ オーギュメンテーション
の仕組みを作り、そして時間と手間のかかる
ハイパーパラメータ チューニング
を実施するなど、データ サイエンティストとしてのノウハウを投入して開発してきました。
一方、AutoML Vision の場合は、画像とラベルをアップロードして、Train ボタンをクリックするだけです。学習にともなう面倒な試行錯誤や開発工程は不要でした。
AutoML Vision では画像とラベルをアップロードするだけで学習できる
AutoML Vision では、Base と Advanced の 2 種類の学習モードを選択できます。Base モードでは、土井さんの画像データの場合、18 分で学習が終わります。Advanced モードでは、およそ 24 時間を要します。いずれの場合も、さまざまな ML モデルを試したり、データ オーギュメンテーションやハイパーパラメータ チューニングに時間を費やしたりする必要はありません。データ サイエンティストの「技」が自動化されています。
この AutoML Vision が現場に与えるインパクトについて、土井さんは次のように説明します。「Base モードでは、そこそこの精度をとても短時間で得られます。一方、Advanced モードでは、最先端レベルの精度をデータ サイエンティストの知識なしに達成できます。このサービスを使えば、データ サイエンティストの仕事の生産性はぐんと上がるはずです。いま企業のデータ サイエンティストのもとにはたくさんの AI 案件が舞い込んでおり、それぞれの PoC でのディープ ラーニング適用を迅速にこなしていく必要があります。AutoML Vision があれば、学習や最適化に長い時間をとられることはありません。つまり、わずかな人数のデータ サイエンティストでも、より多くの案件をこなせるようになります」
また土井さんは、AutoML Vision が備える認識機能も高く評価しています。「学習したすぐ後に、その ML モデルを使ってスケーラブルなオンライン認識サービスを利用できる点も、とても便利です。通常、こうした実運用向けのサービス インフラの構築と運用は、データ サイエンティストにとってもうひとつの頭痛のタネなのです」
メルカリのブランド品を 91% の精度で分類
そして AutoML Vision は、まったく別の用途でもその威力を発揮しています。
メルカリ
でのブランド品識別です。
メルカリ
メルカリでは、ブランド品向けの新しいアプリ、
メルカリ メゾンズ
を提供開始しました。このアプリでの導入に向けて、12 種類の主要なブランド品を画像から識別できる ML モデルの開発を進めてきました。このモデルでは、
TensorFlow
上で
VGG16
による
転移学習
を用いることで
75%
の精度を得ていました。
アップロードした製品のブランド名を ML モデルでサジェスト
一方、メルカリのデータ サイエンティストが 50,000 枚の画像を用いて AutoML Vision の Advanced モードを試したところ、
91.3%
の精度(precisionスコア)を達成。既存モデルより 15 ポイント高い成果が得られました。
メルカリが作成した AutoML Vision モデル(Advanced モード)の精度
メルカリが作成した AutoML Vision モデル(Advanced モード)の混同行列
AutoML Vision の高精度の理由
メルカリのデータ サイエンティスト藤原秀平さんは、この結果を見て「Google はどんな仕組みを使ってこんな精度を出しているのか!」と驚いたそうです。
AutoML Vision の Advanced モードの裏側では何が行われているのでしょうか。Advanced モードでは、一般的な転移学習だけでなく、
NASNet
と呼ばれる Google 最新の learning2learn 技術が投入されています。
AutoML for large scale image classification and object detection
より引用
NASNet では、ML で ML の最適化を行います。つまり、個々の学習画像について最適なディープ ラーニング モデルの設計を行う、メタレベルの ML モデルを使用します。これが Advanced モードの高精度のカギであり、Google が掲げる「AI の民主化」を象徴する技術と言えます。最先端のディープ ラーニング技術の習得に何年もの時間をかけずとも、その恩恵を多くのユーザーが得られます。
また藤原さんは、AutoML Vision の UI の使いやすさも評価しています。「とても使いやすい UI が気に入っています。ハイパーパラメータ チューニングも不要で、学習後の精度も混同行列ですぐに確認できるのが便利です。また、Google 側での手作業によるラベル付け作業もこの UI から依頼できるので、画像認識の開発でいちばん時間のかかるラベル付けを自前でやらずに済むのも助かります。AutoML Vision の公開ベータ版のローンチが待ち遠しいです」
メルカリの急成長を支えた要因のひとつに、そのスマホ アプリのユーザ エクスペリエンス品質の高さがあります。ブランド名検出の精度が高まれば、その価値はさらに引き上げられると期待されます。
次のステップ
この記事で見てきたとおり、AutoML Vision はビジネスの現場でもその威力を発揮しつつあります。製品について詳しくは、
AutoML Vision 製品ページ
をご覧ください。
12 か月間のトライアル
300 ドル相当が無料になるトライアルで、あらゆる GCP プロダクトをお試しいただけます。
Labels
.NET
.NET Core
.NET Core ランタイム
.NET Foundation
#gc_inside
#gc-inside
#GoogleCloudSummit
#GoogleNext18
#GoogleNext19
#inevitableja
Access Management
Access Transparency
Advanced Solutions Lab
AI
AI Hub
AlphaGo
Ansible
Anthos
Anvato
Apache Beam
Apache Maven
Apache Spark
API
Apigee
APIs Explore
App Engine
App Engine Flex
App Engine flexible
AppArmor
AppEngine
AppScale
AprilFool
AR
Artifactory
ASL
ASP.NET
ASP.NET Core
Attunity
AutoML Vision
AWS
Big Data
Big Data NoSQL
BigQuery
BigQuery Data Transfer Service
BigQuery GIS
Billing Alerts
Bime by Zendesk
Bitbucket
Borg
BOSH Google CPI
Bower
bq_sushi
BreezoMeter
BYOSL
Capacitor
Chromium OS
Client Libraries
Cloud API
Cloud Armor
Cloud Audit Logging
Cloud AutoML
Cloud Bigtable
Cloud Billing Catalog API
Cloud Billing reports
Cloud CDN
Cloud Client Libraries
Cloud Console
Cloud Consoleアプリ
Cloud Container Builder
Cloud Dataflow
Cloud Dataflow SDK
Cloud Datalab
Cloud Dataprep
Cloud Dataproc
Cloud Datastore
Cloud Debugger
Cloud Deployment Manager
Cloud Endpoints
Cloud Firestore
Cloud Foundry
Cloud Foundry Foundation
Cloud Functions
Cloud Healthcare API
Cloud HSM
Cloud IAM
Cloud IAP
Cloud Identity
Cloud IoT Core
Cloud Jobs API
Cloud KMS
Cloud Launcher
Cloud Load Balancing
Cloud Machine Learning
Cloud Memorystore
Cloud Memorystore for Redis
Cloud monitoring
Cloud NAT
Cloud Natural Language API
Cloud Networking
Cloud OnAir
Cloud OnBoard
cloud Pub/Sub
Cloud Resource Manager
Cloud Resource Manager API
Cloud SCC
Cloud SDK
Cloud SDK for Windows
Cloud Security Command Center
Cloud Services Platform
Cloud Source Repositories
Cloud Spanner
Cloud Speech API
Cloud Speech-to-Text
Cloud SQL
Cloud Storage
Cloud Storage FUSE
Cloud Tools for PowerShell
Cloud Tools PowerShell
Cloud TPU
Cloud Translation
Cloud Translation API
Cloud Virtual Network
Cloud Vision
Cloud VPC
CloudBerry Backup
CloudBerry Lab
CloudConnect
CloudEndure
Cloudflare
Cloudian
CloudML
Cluster Federation
Codefresh
Codelabs
Cohesity
Coldline
Colossus
Compute Engine
Compute user Accounts
Container Engine
Container Registry
Container-Optimized OS
Container-VM Image
Couchbase
Coursera
CRE
CSEK
Customer Reliability Engineering
Data Studio
Databases
Dbvisit
DDoS
Debugger
Dedicated Interconnect
deep learning
Deployment Manager
Developer Console
Developers
DevOps
Dialogflow
Disney
DLP API
Docker
Dockerfile
Drain
Dreamel
Eclipse
Eclipse Orion
Education Grants
Elasticsearch
Elastifile
Energy Sciences Network
Error Reporting
ESNet
Evernote
FASTER
Fastly
Firebase
Firebase Analytics
Firebase Authentication
Flexible Environment
Forseti Security
G Suite
Gartner
gcloud
GCP
GCP Census
GCP 移行ガイド
GCP 認定資格チャレンジ
GCPUG
GCP導入事例
gcsfuse
GEO
GitHub
GitLab
GKE
Go
Go 言語
Google App Engine
Google Apps
Google Certified Professional - Data Engineer
Google Cloud
Google Cloud Certification Program
Google Cloud Client Libraries
Google Cloud Console
Google Cloud Dataflow
Google Cloud Datalab
Google Cloud Datastore
Google Cloud Endpoints
Google Cloud Explorer
Google Cloud Identity and Access Management
Google Cloud INSIDE
Google Cloud INSIDE Digital
Google Cloud INSIDE FinTech
Google Cloud Interconnect
Google Cloud Launcher
Google Cloud Logging
Google Cloud Next '18 in Tokyo
Google Cloud Next '19 in Tokyo
Google Cloud Platform
Google Cloud Resource Manager
Google Cloud Security Scanner
Google Cloud Shell
Google Cloud SQL
Google Cloud Storage
Google Cloud Storage Nearline
Google Cloud Summit '18
Google Cloud Summit ’18
Google Cloud Tools for IntelliJ
Google Code
Google Compute Engine
Google Container Engine
Google Data Analytics
Google Data Studio
Google Date Studio
Google Deployment Manager
Google Drive
Google Earth Engine
Google Genomics
Google Kubernetes Engine
Google maps
google maps api
Google Maps APIs
Google Maps Platform
Google SafeSearch
Google Service Control
Google Sheets
Google Slides
Google Translate
Google Trust Services
Google VPC
Google マップ
Google 公認プロフェッショナル
GoogleNext18
GPU
Gradle
Grafeas
GroupBy
gRPC
HA / DR
Haskell
HEPCloud
HIPAA
Horizon
HTCondor
IaaS
IAM
IBM
IBM POWER9
icon
IERS
Improbable
INEVITABLE ja night
inevitableja
InShorts
Intel
IntelliJ
Internal Load Balancing
Internet2
IoT
Issue Tracker
Java
Jenkins
JFrog
JFrog Artifactory SaaS
Jupiter
Jupyter
Kaggle
Kayenta
Khan Academy
Knative
Komprise
kubefed
Kubeflow Pipelines
Kubernetes
KVM
Landsat
load shedding
Local SSD
Logging
Looker
Machine Learning
Magenta
Managed Instance Group
Managed Instance Group Updater
Maps API
Maps-sensei
Mapsコーナー
Maven
Maxon Cinema 4D
MightyTV
Mission Control
MongoDB
MQTT
Multiplay
MySQL
Nearline
Network Time Protocol
Networking
neural networks
Next
Node
NoSQL
NTP
NuGet パッケージ
OCP
OLDISM
Open Compute Project
OpenCAPI
OpenCAPI Consortium
OpenShift Dedicated
Orbitera
Organization
Orion
Osaka
Paas
Panda
Particle
Partner Interconnect
Percona
Pete's Dragon
Pivotal
Pivotal Cloud Foundry
PLCN
Podcast
Pokemon GO
Pokémon GO
Poseidon
Postgre
PowerPoint
PowerShell
Professional Cloud Network Engineer
Protocol Buffers
Puppet
Pythian
Python
Qwiklabs
Rails
Raspberry Pi
Red Hat
Redis
Regional Managed Instance Groups
Ruby
Rust
SAP
SAP Cloud Platform
SC16
ScaleArc
Secure LDAP
Security & Identity
Sentinel-2
Service Broker
Serving Websites
Shared VPC
SideFX Houdini
SIGOPS Hall of Fame Award
Sinatra
Site Reliability Engineering
Skaffold
SLA
Slack
SLI
SLO
Slurm
Snap
Spaceknow
SpatialOS
Spinnaker
Spring
SQL Server
SRE
SSL policies
Stack Overflow
Stackdriver
Stackdriver Agent
Stackdriver APM
Stackdriver Debugger
Stackdriver Diagnostics
Stackdriver Error Reporting
Stackdriver Logging
Stackdriver Monitoring
Stackdriver Trace
Stanford
Startups
StatefulSets
Storage & Databases
StorReduce
Streak
Sureline
Sysbench
Tableau
Talend
Tensor Flow
Tensor Processing Unit
TensorFlow
Terraform
The Carousel
TPU
Trace
Transfer Appliance
Transfer Service
Translate API
Uber
Velostrata
Veritas
Video Intelligence API
Vision API
Visual Studio
Visualization
Vitess
VM
VM Image
VPC Flow Logs
VR
VSS
Waze
Weave Cloud
Web Risk AP
Webyog
Wide and Deep
Windows Server
Windows ワークロード
Wix
Worlds Adrift
Xplenty
Yellowfin
YouTube
Zaius
Zaius P9 Server
Zipkin
ZYNC Render
アーキテクチャ図
イベント
エラーバジェット
エンティティ
オンライン教育
クラウド アーキテクト
クラウド移行
グローバル ネットワーク
ゲーム
コードラボ
コミュニティ
コンテスト
コンピューティング
サーバーレス
サービス アカウント
サポート
ジッター
ショート動画シリーズ
スタートガイド
ストレージ
セキュリティ
セミナー
ソリューション ガイド
ソリューション: メディア
データ エンジニア
データセンター
デベロッパー
パートナーシップ
ビッグデータ
ファジング
プリエンプティブル GPU
プリエンプティブル VM
フルマネージド
ヘルスケア
ホワイトペーパー
マイクロサービス
まっぷす先生
マルチクラウド
リージョン
ロード シェディング
運用管理
可用性
海底ケーブル
機械学習
金融
継続的デリバリ
月刊ニュース
資格、認定
新機能、アップデート
深層学習
深層強化学習
人気記事ランキング
内部負荷分散
認定試験
認定資格
料金
Archive
2019
8月
7月
6月
5月
4月
3月
2月
1月
2018
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2017
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2016
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2015
12月
11月
10月
9月
8月
7月
6月
5月
4月
3月
2月
1月
2014
12月
11月
10月
9月
8月
6月
5月
4月
3月
2月
Feed
月刊ニュースレターに
登録
新着ポストをメールで受け取る
Follow @GoogleCloud_jp