医薬品チームブログ
データ制作

添付文書用XML解析 5. Lang要素とxml:lang属性

投稿日:2017.12.27

更新日:2022.08.01


まず先日XMLスキーマは0.9.5が公開されました。前回までのブログの内容に変更が必要な場合は、都度内容を修正する予定ですが、多少対応が遅くなることもあるかと思いますのでご注意ください。

Lang要素

Lang要素は添付文書用XMLの基本単位

今回はLang要素及びxml:lang属性について解説します。

以前にも軽く触れましたが、Lang要素は添付文書の内容を記述する為の要素で、添付文書用XMLの基本単位とも言える要素です。添付文書の内容は基本的にこの要素内に記述します。Detail要素やHeader要素等の内部で必ず必要になります。
今までのサンプルでも頻繁に使用していました。

		
			
				いろはにほへと
			
		

Detail要素は、添付文書の文章を包括する要素ですが、文章はDetail要素の直下には記述しません。少し冗長な感じがしますが、更に包括されたLang要素の内部に記述します。

書式設定ほか様々なタグで添付文書を表現

Lang要素内では書式の設定が出来ます。下記はBoldタグとUnderタグを使用して太字や下線を表現しています。「いろは」の部分だけに太字を、「ほへと」に下線を引く例です。

いろはほへと

		
			
				いろはほへと
			
		

Lang要素内では、その他Sup要素(上付き)、Sub要素(下付き)、等を用いて書式を設定できます。

また、文書中の画像や、引用文献、他の項目名を表現する為のタグ等、多様なタグが用意されており、今までSGMLでは表現出来なかった多様な添付文書の記述に対応できる様になると考えられます。

xml:lang属性

使用言語の設定

Lang要素には必ずxml:lang属性が必要です。これは使用する言語を示す属性です。
添付文書は当然日本語で作成されているので、この属性は日本語を表す”ja”にします。基本的にLang要素を使用する際はすべてxml:lang属性は”ja”にしておきます。今までのご紹介したサンプルでもすべて”ja”となっています。

		
			
				日本語
			
		
添付文書の多言語化を見越した属性?

ではどのような場合に”ja”以外の属性値を使用するのでしょうか。

現状では日本語のみで作成している添付文書ですが、グローバル化に伴い添付文書を日本語以外の言語対応が必要になった場合、”ja”以外の属性値を使用して表現する為だと考えられます。

例えば下記の様にLang要素を併記し、それぞれのxml:lang属性を日本語には”ja”、英語には”en”を指定する事で、日本語と英語の両方で情報を記述する事が可能です。

		
			
				くすり
				Drug
			
		

このように言語を指定して併記することにより、HTMLなどで言語を切り替えて表示する等の利用方法が考えられます。内容の正確さが要求される添付文書において、機械的な翻訳を介さずに言語を切り替えられることは大きなメリットになるでしょう。

あくまでも上記は多言語が必要になった場合の例であり、現状は英語と日本語の併記を求められている訳ではありません。しかし、このようなxml:lang属性が設けられている以上、いずれ添付文書XMLが多言語化していく可能性は示唆されます。

なおxml:lang属性は殆どの要素に設定可能となっているのですが、Lang要素に限りxml:lang属性の使用は必須になります。
Lang要素は内容を記述する際は必須になる為、内容の記述には漏れなく言語指定がなされる構造になっています。

ちなみにxml:lang属性だけ他の属性と毛色が異なりますが、これはXMLの仕様として元々定義されているものだからです。
先ほどの例以外にも様々な言語を指定可能で、中国語なら”zh”、ドイツ語なら”de”などの指定が可能です。

まとめ

  • Lang要素は、添付文書の文章を記述する添付文書XMLの基本要素。書式設定などを行える。
  • xml:lang属性は、使用言語を指定する属性。基本的に”ja”で日本語を指定して使用する。今後英語等で添付文書情報を記述する事になった時に使用するものと考えられる。

簡単な説明でしたがLang要素とxml:lang属性の用途はお分かりいただけたでしょうか。
今までと異なり実用的な使用方法に直結する内容だったかと思います。

次回はSGMLと大きく仕様が異なる「その他の副作用」の記述について見ていきたいと思います。