「切り貼り」の一人歩きを憂う
2014年 05月 05日
1月末にNature誌に発表された2本の論文をきっかけに、話はさらに広がってNature誌論文筆頭著者の所属研究機関以外の研究者へも疑義が飛び火した。理研の不正調査委員会委員がすでに発表していた論文に関して、不正の疑いがあるという指摘が理研や他の大学に通報されたのだ。誰がどのような意図をもって「匿名の告発」を行ったのかは不明であるが、くだんのNature誌論文筆頭著者の弁護団からは「捏造・改竄の定義を求める」質問状が理化学研究所に提出されていた。
質問状は、理研の調査報告書が解釈を明らかにしていないため、弁護団との主張がかみ合っていないとしている。理研の規定で改ざんは、「データの変更などにより結果を真正でないものに加工する」と定義されている。これに対し弁護団は、「加工した画像の結果が、真正な画像によって得られる結果と異なる場合」でも、真正な画像があれば改ざんには当たらないと主張している。捏造についても、実験せずにデータを提出した場合などを指すとし、小保方氏の画像切り張りや取り違えは改ざんや捏造に当たらないとしている。【毎日新聞4月30日付け畠山哲郎】
5月2日付けの調査委員の一人の所属先大学からの予備調査結果の開示により、メディアは、弁護団がさらに申立人擁護の根拠を得たかのようなコメントを報じた。
三木氏はコメントの中で「STAP論文は許されず、田賀論文は許されるとすれば、画像の切り張りや引き伸ばしについて許される場合と許されない場合があることになる」と指摘。「改竄(かいざん)の定義を明確にすることを改めて求める」とした。(5月3日、産経新聞)
まず、「画像使い回し疑義」については、これを告発した方が、論文の中身はおろか科学論文の作法をまったく理解していない可能性があるので、まずそのことを指摘しておく。画像のデータでは、低倍率で広い視野を示すものと、その中の特定の細胞などを拡大してわかりやすく示すことは一般的に行われている。むしろ、高倍率の画像のみを示すことにより「捏造・盗用ではない」ことを示すものである。筆者は「告発文」そのものは見ていないが、そのことを理解した上で告発文に含めていたのだとすると、そのこと自体が「悪意」をもった告発であることを示す可能性も考えられる。
今回の騒動では告発者が、分子生物学系の研究において多用される各種の電気泳動データに関して疑義を申し立てているようなので、どのような「ルール」があるのかを示しておきたい。以下は、日本分子生物学会の若手教育ワーキンググループ(当時)が行ったフォーラムをもとに、2008年に中山敬一氏が「蛋白質核酸酵素」という雑誌に寄稿した文章「Photoshopによるゲルの画像調整」からの抜粋である。
1)コピー&ペースト(当たり前) ←しかし過去の捏造の大部分はこれ
2)タッチアップ(写真の傷を修正するためのツール)の使用
3)画面の一部のみ、明るさやコントラストを変更すること
4)異なった時間・場所で行った実験結果を、あたかも一つのデータのように見せること(例えば、同じ電気泳動ゲル上の離れたレーンを近づける場合でも、間に境界線を描かなければならない)
1)~3)は誰でもわかることで、確信犯的なケースしかこのルールを破る人はいないだろう。また専門家が見れば、このような処理は簡単に見抜くことができる。4)に関してはきちんと境界線を描いていないケースを時々認めることがある。注意されたい。
上記の抜粋において、1)はわかりやすいだろう。生命科学系の実験はかなりの部分「相対的評価」をするので、常に「対照群に比してどうか」を示す。したがって、電気泳動の場合にも、同じゲルに分子量マーカーや、対照条件、それと比較したいサンプルA、B、Cをともに泳動する必要がある。「対照条件はいつでも同じ結果が得られる」からといって、その結果の「バンド」を「使い回し」してコピペしては実験の意味を為さない。だからこそ、実験ノートにはどの「レーン」がどんな条件のサンプルであるかを記載することが必要である。
当然のことながら、画像ソフトを用いて論文用の画像のコントラストなどを変えると、これらの「細工」は露呈する。
2)のタッチアップは、画像の一部についた傷を「スタンプツール」などで修正することであり、芸術作品ならばそれもありえるかもしれないが、科学論文では「やってはいけない」ことになっている。では、ほんの少しだけ傷があるデータはどうするか。それは「実験をやり直す」ことが必要となる。些細なことなのに、と思うかもしれないが、ここで「不誠実」なことをすると、すべてのデータが疑わしくなってしまうからである。
この場合もまた、画像ソフトを用いて論文用の画像のコントラストなどを変えると、傷の修正は露呈する。
3)はもう少し深刻な問題がある。電気泳動のデータから「定量的な解析」を行う場合には、「バンドの濃さ」を測定することがある。このとき、Photoshopアプリ上で不適切な「調整」を行うと、例えば対照群とサンプルAの量を比較したい場合に、生データ上の比と異なる値を出すことが可能である(中山先生の図を拝借するので参照されたい)。もし、自分なりボスなりがある仮説を持っていたとして、それに合うような数値が欲しいというような場合に、こういう処理をするとその値が得られてしまうのである。
この場合、生データを見ないと本当のところがどうなのかは不明である。ただし、このような処理をした結果として、バンドの画像が不自然になることにより、改竄が発覚することもある。
4)が今回、新聞などの見出しにもなった「切り貼り」処理に近いものであろう。これはどのような場合に生じるか? 実験の際に、ゲルの左から、分子量マーカー、サンプルA、B、C……というサンプルを各レーンに流して結果を得て、さて論文の原稿を書いてみたところ、論旨として、A、C、Bの順に述べた方が論旨がわかりやすい、となったとしよう。もっとも誠実な対応は、サンプルの順番をA、C、Bにして再度実験をやり直してデータを取ることである。だがその時間が無い。そこでPC上でレーンの「切り貼り」を行うことにして時間を短縮する、という対応がこの場合に相当する。
このような「同じ条件で行った実験(当然ながらそのことがノートに記載されているとして)」のゲルのレーンBとCを入れ替えて示す場合には、「入れ替えた」ことが明示されるように、レーンの間に隙間を入れる(もしくは白い線を入れる)などをすることが推奨されている。各条件を3レーンずつ流しておいて、もっとも美しいバンドを選択して(切り貼りして)並べて示したい、というような気持もわからない訳ではないが、できれば全部並べて示すべきであるし、切り取って貼り合わせたのであれば、それがわかるようにしなければならない。
この場合、「異なった時間・場所で行った実験結果」を貼り合わせるべきではない。なぜなら、上記にも述べたように、生命科学系の実験のかなりの部分が「相対評価」であって、「絶対定量ではない」ため、同一の実験条件でサンプルA、B、Cを比較しなければ、本当に相対的な評価ができないからである。
当然のことながら、これらの「貼り合わせ」は、画像ソフトを用いて論文用の画像のコントラストなどを変えると、簡単に露呈する。
さて、ここが重要なのであるが、これらの「画像の切り貼り」が「意図をもって為された改竄」かどうかは、論文を読んだだけではわからない。
では、どうやって「意図をもって為された改竄」か、そうでないものかを見分けるのか? それは、日時やサンプルについての情報が適切に記述された「実験ノート」などに残された「生データについての情報」を照らし合わせることにより、当該実験に詳しい研究者であれば理解できる。
しかしながら、このような「生データ」が無い場合には、実験者がいくら『悪意がない』ことを主張しても疑義を晴らすことができないのである。
ただし、ここでまた問題なのだが、現時点では「生データ」を何年間保管すべきか、ということについて、明確に示されたルールが存在していない。現在では考えられないことだが、かつては研究者によっては、論文を投稿し、査読とリバイスを経て無事に受理された時点で廃棄することもあったかもしれない。普通は、まぁ、もう少し長い期間、その研究を引き継ぐ学生さんやポスドクなどが研究の筋道を辿ったり、論文への問合せに対応するために残しておいたりしただろう。ただし、実験を担当した学生やポスドクが研究室を移動する際に持って行ってしまう、研究室の引っ越しなどに伴って処分するなどは、現実的に起きたことなのではと思われる。特許等への対応が一般的となった現在では、原則、実験ノートや成果物は所属機関に帰属するが、2000年くらいまでの日本国内では、上記のようなこともあったと思う。
さて、では「論文捏造は切り貼りをしないとできないか」というと、残念ながらまったくそうではない。注意深く実験を組み立てれば、生データレベルから「真正ではない」結果を出すことは可能である。そのような事例として、1980年代初頭の「マーク・スペクター事件」を紹介しておく。すでに、読み物としては、『背信の科学者たちー論文捏造、データ改ざんはなぜ繰り返されるのか』(松野賢治訳、講談社ブルーバックス)や、福岡伸一さんの『世界は分けてもわからない』(講談社現代新書)に取り上げられているので、詳しくはそちらを参照されたし。
ちなみに、コーネル大学HPではこちらのように経緯が詳しく情報公開されている(英語PDF)
当時、ATP分解酵素に関する研究で世界をリードしていた米国コーネル大学のラッカー研に大学院生として、参入したスペクターが、他のラボメンバーが決して成功しなかった実験を次々とこなして、ひと月足らずの間にデータを出して論文に発表していった。この場合のデータ捏造は、ラッカーの仮説がどういうものかをよく理解し、それに沿ったデータを「作る」にはどうしたらよいかを考えて、最適化した実験を組んでいるのだ。この場合は、論文を見ても、ノートを見ても捏造かどうかはわからない。いわば完全犯罪である。
……とはいえ、共同研究者のヴォークトが「たまたま」誰もいない実験室でスペクターの実験に使用した電気泳動ゲルにガイガーカウンターを近づけてみたことによって捏造は発覚した。ただし、もしヴォークトによる捏造の発覚が無かったとしても、恐らくその後数十年の間に追試ができず、「あれは間違いだったね」ということになっていたのではと想像する。この件は、少なくともニューヨーク・タイムズには載ったのだろうが、当時の米国市民の間でどこまで話が伝わっていたかについては私にはわからない。
スペクターは何も認めなかった。捏造の意図も、捏造の実行も。自分は何も知らない。こんなことは誰かが自分を陥れるために行ったことだ。そう主張した。ラッカーは考えた。重要なのは予断を持って何ごとかを決めてしまわないことだ。スペクターがデータを捏造したという証拠は何もない。ラッカーはスペクターに命じた。三週間の猶予を与える。すべてのリン酸化酵素を新たに生成しなおして自分に手渡してほしい。その活性をこちらで調べ直す。スペクターは言下にイエスと答えた。自信に満ちていた。(福岡伸一『世界は分けてもわからない』第12章「治すすべのない病」より)
ちなみに、スペクターはコーネル大学追放の後、どうなったか? 上記のコーネル大学で公表されている記録によれば、その後、アイオワ大学にてオステオパシー医療の資格を取り、心臓外科のチームに入ってデータ処理に関わっていた。ところが、このときもまた、虚偽の医師免許を使っていたという。つまり、「捏造は習慣性がある」のである。
さて、以上、長くなったが、過日、朝日新聞オピニオン欄の「耕論」に挙げたことを繰り返しておこう。生命科学論文の世界にIT技術が浸透してきて、まだ私たちはそれを使いこなしていないように思う。データの示し方のルール、保管の仕方、雑誌での取り扱い方など、研究者コミュニティーが早急にルールづくりを進める必要がある。そうでないと「論文のあら探し」によって、健全な科学の進歩が損なわれる可能性がある。もちろん、その大前提として、科学者自身が襟を正し、自らが研究不正を防ぐ意識を高く持たなければならないのは言うまでもない。