PDBファイルを開く

PDBファイルは拡張子が「.pdb」ですが、単なるテキストファイルです。PDBファイルの中身は適当なテキストエディタで見ることができます。例えばTeraPadなどのフリーのテキストエディタを使用してください。(Windows付属のメモ帳では、PDBファイル中の改行が認識されないため使用できません)

PDBファイルの内容

PDBファイルの中身は「ヘッダー」部分と「座標」部分から成ります。テキストエディタで開いてみると、まずヘッダー部分が数百行に渡り記載されています。

  • TITLE
    PDBファイルのタイトルです。構造について簡潔に記載しています。
  • COMPND
    タンパク質分子の名前や説明、含まれる分子数、変異があるか、全長か、ドメインか、残基番号など、少し詳しく記述されます。
  • SOURCE
    解析に使用したタンパク質について、由来生物種や発現系に関する記述です。
  • KEYWDS
    構造についてのキーワードです。
  • EXPDTA
    解析に用いた実験手法です。
  • AUTHOR
    構造をProtein Data Bankに入稿した著者名です。
  • REBDAT
    修正履歴です。
  • JRNL
    構造について発表した論文の情報です。
  • REMARK
    解析に用いた実験データや、決定した構造に関する情報などが記述されています。
  • SEQRES
    配列情報が記述されています。
  • HET HETNAM FORMUL
    タンパク質分子以外に含まれる分子についての記述です。
  • HELIX
    へリック構造を形成する残基についての記述です。
  • SHEET
    シート構造を形成する残基についての記述です。
  • LINK
    例えば金属原子と配位結合しているタンパク質中の原子について記述されます。
  • SITE
    活性部位などの残基情報を記述しています。
  • CRYST
    結晶学的情報です。

PDBファイルの内容
ヘッダー部分の記述が終わったあとに、構造の原子座標が記述されています。座標情報は「ATOM」「HETATM」からはじまる行で記述されます。
右図を参照してください。各行がそれぞれ原子1個の座標を指定しています。各行は、それぞれ12個の部分にスペースで区切られています。

  • 1
    行の左端はATOMあるいはHETATMと記載されています。
  • 2
    原子の通し番号です。
  • 3
    原子の種類を表します。同じ炭素原子でも、アルファ炭素やベータ炭素など、残基中の部位により違います。
  • 4
    残基の種類を三文字表記で表します。
  • 5分子鎖の名前です。構造中に例えば二量体がひとつ含まれている場合、分子鎖Aと分子鎖Bが存在することになります。
  • 6
    残基番号です。
  • 7
    原子のX座標を表します。
  • 8
    原子のY座標を表します。
  • 9
    原子のZ座標を表します。
  • 10
    原子の占有率を表します。例えばタンパク質分子に金属原子が配位している場合、すべての分子にその金属原子が含まれているとは限りません。構造計算の過程で、金属原子が配位している分子の比率を計算することがあります。
  • 11
    温度因子です。数値が高い部分はタンパク質分子中で構造の揺らぎが大きい場所、つまり水溶液中で動きが大きい部分を表します。
  • 12
    元素名です。
  • 例えば二量体のうちの1つだけについての構造図が必要だったり、ドメインなど一部分についてのみの構造図が必要だったりなど、必要に応じて自由にPDBファイルをテキストエディタで加工して使用することができます。