W3C

– DRAFT –
MCM JP CG

25 July 2024

Attendees

Present
塩浜, 芦村,山本,梨澤,出野,出葉,吉澤,西尾,関屋,高見,中村,占部,臼井,田口,下花,丸山,大亦,小沢,小野寺,市川,木戸,津田,藤井,遠藤,鈴木
Regrets
-
Chair
Endo
Scribe
kaz

Meeting minutes

<hiroki_endo> https://github.com/w3c-cg/mcm-jp/tree/main/meetings/2024-07-25

Agenda

遠藤: (アジェンダページをさらっと)

議事録ツール

遠藤: W3Cでは,IRCツールを使って議事録を取ることが多い
… アジェンダページにもリンクを入れたが,IRCに接続いただきたい

IRCリンク (#mcm-jp チャンネル)

遠藤: 議事録の取り方が難しいので,芦村さんにお願いしている

IRCの使い方

kaz: 議事録の入り方
… トピックタイトルの付け方

IRCの使い方

遠藤: 芦村さんがいる時は手伝ってもらう
… あるいは私がお手伝いする
… W3Cの会議で一般的に使われているので,本CGでも使ってみたい

前回議事録

6/28議事録

遠藤: (画面共有)
… 特に問題なければ承認としたい

(問題なく承認)

遠藤: (ポイント振返り)
… CG概要,自己紹介,Charter案

CGチャーターのレビュー

<hiroki_endo> MCM JP CGチャーター案

遠藤: (変更点の概要)
… スコープの図を追加
… 関連リエゾン追加
… Web-based Digital Twins for Smart Cities IGは,まだ設立されていない

芦村: 来週にずれ込むので,とりあえず,リンクなしで触れていただければ幸い

塩浜: 外部団体として記載される対象として,事前の調整が必要かと思うが,いつごろまでに確定するべきか

遠藤: 本日の時点で問題ない情報を記述しておきたい
… 随時アップデートしていきたい

塩浜: 了解

遠藤: W3CグループのCharterを書く際には,W3C内部グループと,関連する外部団体を明記する
… 具体的に何をしないといけないか,という強制があるわけではないが,関連団体と事前に調整しつつ記載していきたい
… 本日版としては,現状で確定しているグループおよび団体を記述している

日付

遠藤: グループ設立時点か,Charter公開時点かのいずれかで指定したい

芦村: "Start Date" はグループ設立時
… "Last Modified" に本日の日付を入れるとよい

遠藤: 了解
… 本日の議論にもとづいて反映したい

ユースケース・議題などの紹介

6/28資料

遠藤: ユースケース,困っている課題等について共有

出版に関する事例紹介(小学館)

[slide 1]

小沢: 出版社の取扱い商品は多岐に渡る
… 主力製品は紙の書籍だが,書店数や人口動態から,多様性や長期性のメリットを享受できていた
… 近年は,流通フォーマットとしてEPUBベースの電子書籍が使われ始めている
… 業界では標準のフォーマットがあり,流通につながっている
… しかし,受け取る側,読者側のニーズにより一層応えるために,メタデータの高度化が必要

[slide 2]

塩浜: Publishing BGの共同議長
… 出版業界におけるメタデータによる連携については,紙と電子の書籍用展開を越えた,他メディアへのコンテンツ展開を目指したリッチ化が進みつつある
… 小学館が進めているマンガペディアは,マンガ関連のエンサイクロペディア
… 通常の書籍情報を越えた作品のあらゆる展開を想定したもの
… それぞれの分野に最適なメタデータを用意する必要がある
… 出版,放送等の垣根を越えたメディア関連業界全体での連携を想定
… W3C MEIG議長である,BBCのChris Needhamさんとも相談中
… 多メディア展開について
… 本CGで,国内および海外での取り組みについて検討を進めていただきたい
… そのために,Publishing BGとしても協力したい

[slide 3]

小沢: 小学館の取り組み紹介
… 既存の製品流通について
… ISBN, JDCN, 書誌情報等が,印刷物やEPUBに使われている
… しかし,製品の情報をうまくお届けできていないという課題がある
… 発売日,価格,内容等だけでなく,何を誰に届けるか

[slide 4]

小沢: IPの流通に備えて
… 紙の本をDB化
… 自社および他社に提供していく (CPOTと協力)

[slide 5]

小沢: Contents Edit System
… 一例として,図鑑のデータベース
… マルチメディアを中心としたデータ編集・権利状態管理・データ出力のシステム
… 「ひぐらし」という蝉の記事
… (左側に写真,右側に詳しいメタデータ)

[slide 6]

小沢: Contents Edit System続き
… データ連携によるサイクル
… データ管理->データ編集->データ出力->データ連携
… データ連携にあたっては,コトバンクとの連携 (コトバンクはCPOT配下)

[slide 7]

小沢: アウトプット事例1
… コトバンクに提供することで広告収入を得る

[slide 8]

小沢: アウトプット事例2
… COEDOビール✕NEC✕小学館
… 人生醸造claft
… AIの分析で,年代に応じたビールを提供

[slide 9]

小沢: 人生醸造ビール
… 小学館の過去40年分の雑誌紙面情報
… NECの人工知能「WISE」で解析
… 本CGへの参加にあたっては,こういった「連携」ができないか期待している
… 出版業界のコンテンツは映像化等されている
… 出版業界としてどのようなメタデータを用意すれば,他業界での展開をやりやすいか知りたい
… 例えば,「名探偵コナン」というコンテンツがあり,学習マンガ等に展開しているが
… 他メディアへ展開する際,例えば,学習ドリル等
… お薦めコンテンツを展開していく際等

遠藤: 小沢さん,塩浜さん,ご説明ありがとうございます
… 具体的事例も交えたお話で,イメージが広がると思います
… 本日,時間があれば,NHKからも技研公開での発表内容等について触れたい

文字入力ソフト(IME)に関する事例紹介(オムロンソフトウェア)

出野: IMEという文字入力ソフトを展開
… 内容紹介および,議論のタネを提供したい
… 文字入力システム概要,辞書データ,IMEをハブとしたメディア連携

[slide 4]

出野: 言語処理技術「Wnn(うんぬ)」
… スマホ,タブレット,カーナビ等での文字入力
… もともとは日本語のみだったが,今は50言語に対応

[slide 5]

出野: 導入事例
… 携帯や組み込み機器

[slide 6]

出野: 日本語IMEの特徴
… 欧米言語とご異なる処理
… 変換処理: 読み文字列を別表記へ変換 (日本語の場合,漢字,ひらがな,カタカナ,英数字が混在)
… 文節区切り: どこで区切るかで変換結果が変わる (今日は医者に行く/今日歯医者に行く)
… 同音異義語: 健康施工☓,健康志向○

[slide 7]

出野: Android向け入力ソフト iWnn IME for Android
… 状況適応予測: 5月の昼の場合,12月の夜の場合等,シチュエーションに応じて
… ワイルドカード予測: 冒頭文字と,「残りの何文字か」

[slide 8]

出野: 概略構造
… 変換エンジン + 辞書 = iWnn
… UI部,IME部

[slide 9]

出野: 組み込み辞書とクラウド辞書
… 使用頻度の高い語彙: 組込辞書で
… 仕様頻度が低い語彙: クラウド辞書で
… 「外部変換」機能で切替

[slide 9]

出野: 辞書データについて

[slide 10]

出野: 辞書開発プロセス
… まず,語彙収集
… 次に,語彙選別 (品質チェック: 読み・表記,不快語,語彙選別)
… 最後に,語彙収録 (各種辞書へ)

[slide 11]

出野: データ構造/頻度値
… 個々の収録語の属性: 読み,表記,品詞,利用頻度,固有名詞カテゴリ
… 収録後単位の頻度値と辞書自体の頻度値

[slide 12]

出野: IMEをハブとしたメディア連携

[slide 13]

出野: ユーザ接点観点でのIMEの特長
… IMEは,スマホユーザと最大の接点を持つアプリ
… 必ず使われる

[slide 14]

出野: 放送連携IME
… ゴルフ番組を見ている場合は,タイガー・ウッズ等,ゴルフ関連の語彙を優先

遠藤: ありがとうございます
… 具体的事例を含めてご紹介いただき,ユースケース議論のきっかけとして有益
… 例えば,クラウド辞書の紹介における「キングダム」のコンテンツは,「切り抜きジャンプ」からの引用
… 日本語等(CJK)は,独自の言語体系を持っている
… 国際的な標準化議論に則りつつ,日本語独自の特徴を考慮しながら進めたい
… 例えば,日本語コミュニティのWeb標準化への貢献としては,縦書きCSS (CSS Writing Modes) が挙げられる
… また,ルビも一例
… 例えば,IMEの入力および出力にどう関わってくるか,検討したい

Q&A

遠藤: ご質問あれば
… 鈴木さんのご意見もうかがいたい

鈴木: 出版社のメタデータと他業界のメタデータの連携でビジネスが広がることを期待している
… 本日も事例をうかがえてありがたい
… 今後,具体的に,どのようにビジネスケースへつなげていけるか,興味を持っている
… 今,展開している,「デジタルにおけるメタデータ利用」について,オープン化に向けたルールを検討できるとありがたいと思っている

芦村: 引き続き,事例紹介,問題分析,標準化への期待といった流れで検討を進めていただきたい

NHK技研公開の紹介

遠藤: (ビデオコンテンツ紹介)
… 技研公開2024での発表内容について
… 放送と書籍の連携
… EPUBリーダーのコンテンツを読み終わった後,関連の動画コンテツへつながる
… EPUB仕様に則った形で実装している
… また,逆に,放送を見終わった後に,関連書籍を紹介する流れもありえる
… そちらのプロトタイプも作成している
… (夏目漱石の「倫敦塔」の例)

[slide 1]

遠藤: 放送✕出版 メタデータ相互運用事例
… 放送コンテンツの持つEPG情報にプラスして,関連番組,シリーズ,シーズン等のメタデータを利用
… どのシーンで,どのコンテンツが参照されているか
… OPFファイルによるメタデータを利用
… 電子書籍側のISBN等を使って連携
… 今後,詳細内容や,困ったこと等について議論していきたい
… みんなで共通した技術(標準技術)で解決できる部分等についても議論したい
… ご質問等あれば,この場でも,あるいはCGのGitHubでうかがっていきたい

次回会合

遠藤: 夏休みシーズンも近づいているため,9月第一週を想定している
… 例えば,9/4(水)もしくは9/5(木)
… 調整させていただきたい
… 内容については,また皆さんの事例紹介をうかがいたい
… 本日は,ご講演ありがとうございました

[adjourned]

Minutes manually created (not a transcript), formatted by scribe.perl version 227 (Fri Jul 19 09:58:06 2024 UTC).