User:Tsunagun: Difference between revisions

From Mediawiki1
Jump to navigationJump to search
 
(6 intermediate revisions by the same user not shown)
Line 8: Line 8:
* [http://researchmap.jp/tsuna ResearchMap]
* [http://researchmap.jp/tsuna ResearchMap]
* [http://github.com/tsunagun Github]
* [http://github.com/tsunagun Github]
== DBpedia Mappingについて分からないこと ==
* DBpedia Ontologyへの日本語ラベル付与
** 各クラスに対して,どんな手順でラベルを付与するのが適切か(例えば,[http://mappings.dbpedia.org/server/ontology/classes/College College]に単科大学というラベルを与えた理由,経緯,手順は?)
* DBpedia JapaneseのテンプレートとDBpediaのテンプレートが1対1でない場合のマッピング
** 例:
*** 前提:DBpedia Japaneseにテンプレート「animanga/Manga」「animanga/Novel」があり,DBpediaにテンプレート「animanga/Print」がある.
*** 疑問:DBpedia Japaneseのanimanga/Mangaとanimanga/Novelの両方をDBpediaのanimanga/Printにマッピングしてもよいか.
* DBpedia Japaneseのテンプレートの項目とDBpediaのテンプレートの項目が1対1でない場合のマッピング
** 例1:
*** 前提:DBpedia Japaneseのテンプレート「政党」に「公式カラー」があり,DBpediaのテンプレート「Political Party」に「colour」「colourName」がある.
*** 疑問:「公式カラー」は「colour」「colourName」両方とマッピングするべきか,いずれか一つとマッピングするべきか.
** 例2:
*** 前提:DBpediaのテンプレート「Train」に項目「weight」があり,DBpedia Japaneseのテンプレート「鉄道車両」に項目「車両重量」「車両質量」「編成重量」「編成質量」がある.
*** 疑問:DBpedia Japaneseの項目4つをすべてDBpediaのweightに対応付けるべきか,どれか一つをweightにマッピングするべきか.
以下の内容は,LODACによる記事「[http://lod.ac/wiki/DBpedia_Mappings DBpedia Mappings]」に基づいて作成されています.<br />
以下の内容は,[http://creativecommons.org/licenses/by-sa/3.0/ クリエイティブ・コモンズ 表示 - 継承 3.0 非移植] ライセンスの下に提供されています。
== DBpedia Mapping ==
Wikipediaのテンプレートやテーブルを語彙(DBpedia OntologyやFOAF等)に対応付けるための仕組み.
DBpedia Ontology自体の編集もできる.
* [http://mappings.dbpedia.org/index.php/Main_Page DBpedia Mappings Wiki]
* [http://mappings.dbpedia.org/server/statistics/ja/ 作業状況 (Mapping Statistics for ja)]
* [http://mappings.dbpedia.org/server/ontology/classes/ クラス一覧 (Ontology Classes)]
== マッピング作業をはじめるための事前準備 ==
# [http://mappings.dbpedia.org/index.php/Main_Page Mappings Wiki] のアカウントを登録する.
# 数日内にEditor権限が付与されると書かれているが,見逃されてしまうこともある.急ぐ場合や数日経ってもEditor権限が付与されない場合は[https://lists.sourceforge.net/lists/listinfo/dbpedia-discussion dbpedia-discussion@lists.sourceforge.net] のメーリングリストをsubscribeし,Editor権限が欲しい旨をメーリングリストに流す.文面の例を以下に示す.
−−−−
Hi,
I'm planning to modify the mapping wiki of DBpedia Japanese.
I'd like to appreciate it if you could authorize my account as an "Editor".
My acount is "xxxxxxxx".
Thank you.
Best Regards,
xxxxx
−−−−
自分のアカウント名,どの国コードのマッピングを行いたいか(今回の場合はja,DBpedia Japanese)を添えて,Editor権限が欲しい旨を送る.<br />
上記文面を参考に,ユーザTsunagunが送ったメールは以下.<br />
http://sourceforge.net/mailarchive/message.php?msg_id=30435965
== DBpedia Ontology ==
必要な作業: DBpedia Ontologyのクラスやプロパティに日本語ラベルを付ける.足りないものを足す.
作業方法は [http://mappings.dbpedia.org/index.php/How_to_edit_the_DBpedia_Ontology How to edit the DBpedia Ontology]
例: [http://mappings.dbpedia.org/index.php/OntologyClass:Company 会社]
== Infobox and Table Mappings ==
必要な作業: WikipediaのテンプレートとテーブルをDBpedia OntologyやFOAF等の語彙にマッピングする.
マッピングの作業方法は [http://mappings.dbpedia.org/index.php/How_to_edit_DBpedia_Mappings How to edit DBpedia Mappings].
作業のとりかかりは[http://mappings.dbpedia.org/server/statistics/ja/ Mapping Statistics for ja]を参考にすると良い.
例: [http://mappings.dbpedia.org/index.php/Mapping_ja:%E5%9F%BA%E7%A4%8E%E6%83%85%E5%A0%B1_%E4%BC%9A%E7%A4%BE 基礎情報 会社], [http://mappings.dbpedia.org/server/mappings/ja/extractionSamples/Mapping_ja:%E5%9F%BA%E7%A4%8E%E6%83%85%E5%A0%B1_%E4%BC%9A%E7%A4%BE 抽出テスト],
[http://mappings.dbpedia.org/server/templatestatistics/ja/?template=%E5%9F%BA%E7%A4%8E%E6%83%85%E5%A0%B1_%E4%BC%9A%E7%A4%BE マッピング状況]
== フローチャート ==
=== テンプレートごとのマッピングを書きこむページを作る/見つける ===
# [http://mappings.dbpedia.org/server/statistics/ja/ Mapping Statistics for ja] からどれか選ぶ 例:[http://mappings.dbpedia.org/server/templatestatistics/ja/?template=%E9%A7%85%E6%83%85%E5%A0%B1 駅情報]
# ページの頭にある<blockquote>Template Statistics for [http://mappings.dbpedia.org/index.php/Mapping_ja:%E9%A7%85%E6%83%85%E5%A0%B1 駅情報]</blockquote>のようになっているところのリンクに飛ぶ
# まだ作られていないなら create、作られていたら edit を押して、プロパティのマッピングを開始する。
=== マッピングを発見して書きこむ ===
<ol>
<li>そのテンプレートを持っている日本語DBpediaリソース(resource_ja)と,対応する日本語Wikipediaページ(page_ja),英語DBpediaリソース(resource_en),英語Wikipediaページ(page_en)を発見する。例えば、 http://ja.dbpedia.org/sparql で以下のSPARQLクエリを実行すると,駅情報というテンプレートを使用している日本語DBpediaリソースresource_jaと,それに対応するpage_ja,resource_en,page_enを発見できる.(※テンプレート名が半角空白を含む場合は,アンダースコアに置き換えて下記クエリを実行)</li>
SELECT ?resource_ja ?page_ja ?resource_en (REPLACE(STR(?resource_en), <nowiki>"http://dbpedia.org/resource/"</nowiki>, <nowiki>"http://en.wikipedia.org/wiki/"</nowiki>) as ?page_en)
WHERE {
  ?resource_ja dbpprop-ja:wikiPageUsesTemplate <nowiki><http://ja.dbpedia.org/resource/Template:駅情報></nowiki> .
  ?resource_ja foaf:isPrimaryTopicOf ?page_ja .
  ?resource_ja dbpedia-owl:wikiPageInterLanguageLink ?resource_en .
  FILTER REGEX (STR(?resource_en), <nowiki>"http://dbpedia.org"</nowiki>) .
}
LIMIT 100
<li>前の手順で発見したpage_enにアクセスしてみる. 例:[http://en.wikipedia.org/wiki/Shinagawa_Station Shinagawa Station]<br />そのソース(右上のEditを押して見る)を見ると<blockquote><pre>{{Infobox Japan station</pre></blockquote>という文字列が見えるので [http://mappings.dbpedia.org/index.php/Mapping_en:Infobox_japan_station http://mappings.dbpedia.org/index.php/Mapping_en:Infobox_japan_station] に飛ぶ。(<pre>http://mappings.dbpedia.org/index.php/Mapping_en:{アンダーバーで繋いだ初めだけ大文字のテンプレート名}</pre>という規則)</li>
<li>「テンプレートごとのマッピングの追加方法」で作成or編集し始めたページ[http://mappings.dbpedia.org/index.php/Mapping_ja:駅情報 駅情報] にとりあえず [http://mappings.dbpedia.org/index.php/Mapping_en:Infobox_japan_station http://mappings.dbpedia.org/index.php/Mapping_en:Infobox_Japan_station] の内容をコピーする。</li>
<li>対応するpage_jaとpage_en(例:[http://ja.wikipedia.org/wiki/品川駅 品川駅] と [http://en.wikipedia.org/wiki/Shinagawa_Station Shinagawa Station])や,そこで使われているテンプレート(例:[http://ja.wikipedia.org/wiki/Template:%E9%A7%85%E6%83%85%E5%A0%B1 Template:駅情報]や[http://en.wikipedia.org/wiki/Template:Infobox_Japan_station Template:Infobox Japan Station])を見比べながら,前の手順でコピーした内容の<blockquote><pre>{{PropertyMapping | templateProperty = image | ontologyProperty = picture }}</pre></blockquote>の「image」を「画像」に書き変える等対応をつけていく。</li>
=== 緯度経度があるもの ===
マッピングに以下を加えること
<pre>
  {{ GeocoordinatesMapping | latitudeDirection = E(東経)及びW(西経)_ | latitudeDegrees = 緯度度 | latitudeMinutes = 緯度分 | latitudeSeconds = 緯度秒
      | longitudeDirection = N(北緯)及びS(南緯)_ | longitudeDegrees = 経度度 | longitudeMinutes = 経度分 | longitudeSeconds = 経度秒 }}
</pre>
=== その他参考 ===
*[http://mappings.dbpedia.org/server/ontology/classes/ クラス一覧]

Latest revision as of 12:37, 5 February 2013

Name

Tsunagu HONMA(本間維, ほんまつなぐ)

Contact

Web Site

DBpedia Mappingについて分からないこと

  • DBpedia Ontologyへの日本語ラベル付与
    • 各クラスに対して,どんな手順でラベルを付与するのが適切か(例えば,Collegeに単科大学というラベルを与えた理由,経緯,手順は?)
  • DBpedia JapaneseのテンプレートとDBpediaのテンプレートが1対1でない場合のマッピング
    • 例:
      • 前提:DBpedia Japaneseにテンプレート「animanga/Manga」「animanga/Novel」があり,DBpediaにテンプレート「animanga/Print」がある.
      • 疑問:DBpedia Japaneseのanimanga/Mangaとanimanga/Novelの両方をDBpediaのanimanga/Printにマッピングしてもよいか.
  • DBpedia Japaneseのテンプレートの項目とDBpediaのテンプレートの項目が1対1でない場合のマッピング
    • 例1:
      • 前提:DBpedia Japaneseのテンプレート「政党」に「公式カラー」があり,DBpediaのテンプレート「Political Party」に「colour」「colourName」がある.
      • 疑問:「公式カラー」は「colour」「colourName」両方とマッピングするべきか,いずれか一つとマッピングするべきか.
    • 例2:
      • 前提:DBpediaのテンプレート「Train」に項目「weight」があり,DBpedia Japaneseのテンプレート「鉄道車両」に項目「車両重量」「車両質量」「編成重量」「編成質量」がある.
      • 疑問:DBpedia Japaneseの項目4つをすべてDBpediaのweightに対応付けるべきか,どれか一つをweightにマッピングするべきか.


以下の内容は,LODACによる記事「DBpedia Mappings」に基づいて作成されています.
以下の内容は,クリエイティブ・コモンズ 表示 - 継承 3.0 非移植 ライセンスの下に提供されています。

DBpedia Mapping

Wikipediaのテンプレートやテーブルを語彙(DBpedia OntologyやFOAF等)に対応付けるための仕組み. DBpedia Ontology自体の編集もできる.


マッピング作業をはじめるための事前準備

  1. Mappings Wiki のアカウントを登録する.
  2. 数日内にEditor権限が付与されると書かれているが,見逃されてしまうこともある.急ぐ場合や数日経ってもEditor権限が付与されない場合はdbpedia-discussion@lists.sourceforge.net のメーリングリストをsubscribeし,Editor権限が欲しい旨をメーリングリストに流す.文面の例を以下に示す.

−−−−

Hi,

I'm planning to modify the mapping wiki of DBpedia Japanese. I'd like to appreciate it if you could authorize my account as an "Editor". My acount is "xxxxxxxx".

Thank you.

Best Regards, xxxxx

−−−−

自分のアカウント名,どの国コードのマッピングを行いたいか(今回の場合はja,DBpedia Japanese)を添えて,Editor権限が欲しい旨を送る.
上記文面を参考に,ユーザTsunagunが送ったメールは以下.
http://sourceforge.net/mailarchive/message.php?msg_id=30435965

DBpedia Ontology

必要な作業: DBpedia Ontologyのクラスやプロパティに日本語ラベルを付ける.足りないものを足す.

作業方法は How to edit the DBpedia Ontology

例: 会社

Infobox and Table Mappings

必要な作業: WikipediaのテンプレートとテーブルをDBpedia OntologyやFOAF等の語彙にマッピングする.

マッピングの作業方法は How to edit DBpedia Mappings. 作業のとりかかりはMapping Statistics for jaを参考にすると良い.

例: 基礎情報 会社, 抽出テスト, マッピング状況

フローチャート

テンプレートごとのマッピングを書きこむページを作る/見つける

  1. Mapping Statistics for ja からどれか選ぶ 例:駅情報
  2. ページの頭にある

    Template Statistics for 駅情報

    のようになっているところのリンクに飛ぶ
  3. まだ作られていないなら create、作られていたら edit を押して、プロパティのマッピングを開始する。

マッピングを発見して書きこむ

  1. そのテンプレートを持っている日本語DBpediaリソース(resource_ja)と,対応する日本語Wikipediaページ(page_ja),英語DBpediaリソース(resource_en),英語Wikipediaページ(page_en)を発見する。例えば、 http://ja.dbpedia.org/sparql で以下のSPARQLクエリを実行すると,駅情報というテンプレートを使用している日本語DBpediaリソースresource_jaと,それに対応するpage_ja,resource_en,page_enを発見できる.(※テンプレート名が半角空白を含む場合は,アンダースコアに置き換えて下記クエリを実行)
  2. SELECT ?resource_ja ?page_ja ?resource_en (REPLACE(STR(?resource_en), "http://dbpedia.org/resource/", "http://en.wikipedia.org/wiki/") as ?page_en) WHERE { ?resource_ja dbpprop-ja:wikiPageUsesTemplate <http://ja.dbpedia.org/resource/Template:駅情報> . ?resource_ja foaf:isPrimaryTopicOf ?page_ja . ?resource_ja dbpedia-owl:wikiPageInterLanguageLink ?resource_en . FILTER REGEX (STR(?resource_en), "http://dbpedia.org") . } LIMIT 100
  3. 前の手順で発見したpage_enにアクセスしてみる. 例:Shinagawa Station
    そのソース(右上のEditを押して見る)を見ると
    {{Infobox Japan station
    という文字列が見えるので http://mappings.dbpedia.org/index.php/Mapping_en:Infobox_japan_station に飛ぶ。(
    http://mappings.dbpedia.org/index.php/Mapping_en:{アンダーバーで繋いだ初めだけ大文字のテンプレート名}
    という規則)
  4. 「テンプレートごとのマッピングの追加方法」で作成or編集し始めたページ駅情報 にとりあえず http://mappings.dbpedia.org/index.php/Mapping_en:Infobox_Japan_station の内容をコピーする。
  5. 対応するpage_jaとpage_en(例:品川駅Shinagawa Station)や,そこで使われているテンプレート(例:Template:駅情報Template:Infobox Japan Station)を見比べながら,前の手順でコピーした内容の
    {{PropertyMapping | templateProperty = image | ontologyProperty = picture }}
    の「image」を「画像」に書き変える等対応をつけていく。
  6. 緯度経度があるもの

    マッピングに以下を加えること

       {{ GeocoordinatesMapping | latitudeDirection = E(東経)及びW(西経)_ | latitudeDegrees = 緯度度 | latitudeMinutes = 緯度分 | latitudeSeconds = 緯度秒
          | longitudeDirection = N(北緯)及びS(南緯)_ | longitudeDegrees = 経度度 | longitudeMinutes = 経度分 | longitudeSeconds = 経度秒 }}
    

    その他参考