pythonを使って画像の外れ値探しと修正処理

取得した画像に望まれないそして理由のはっきりしている例外が含まれていることはよくある。 そんな時は見た目的にも解析的にも修正できるなら修正しておきたいところ。
理由がわからない場合はそれが事象かもしれないので、修正してしまうのは問題だけど。

この投稿では二次元画像にはっきりと区別できる望まれない何かしらが写り込んでしまった場合の修正の一例について書いてみたい。

画像の取得

raw画像の取得について、以前の投稿で書いたので詳細に興味がある方は参照していただきたい。

リンク: pythonでraw形式の画像を読み込んで処理する方法

tiffやjpegなどだったらもっとシンプルに読み込めるのじゃないかな。
いずれにしろPILなどを用いて画像を読み込み、それを処理のためにnumpyのndarrayに突っ込んでおくのが基本方針だろう。

画像の中から例外値の取得

X線画像

ここではX線の画像に、X線を止める物質が混入したという例で。 まあビームストップなんだけど。
画像は360x1500ピクセルの画像で、上記したようにnumpyのndarrayにピクセルごとに入れてある(上の写真はトリミングしてるので縦800ピクセルになっているけれど)。
ndarrayのshapeがそのまま(1500, 360)になるのでどう処理していけば良いかは直感的にわかりやすい。

この例の場合はビームストップの周りはピクセル強度があからさまに落ちるので(画像の縦に走る黒い線)、強度の低いデータ場所を抜き出すというのが最初の方針になる。
単純に弱いのを抜き出すのでよければ、適当に決めた閾値よりも小さい値を一気に抜き出せば良いので簡単。

ただこの例の場合だと画像の下に行くほど比例的に強度が落ちて行くため、その方法だと画像下部が大量にマスクされてしまう。 それはあまりよろしくない。 いや実はこの画像の例ではよろしかったんだけど、よろしくないことにしておく。

さてじゃあどうするか。 とりあえず閾値を横方向の1データセットごとにセットすることにした(画像を横方向にスライスして最小値を拾う)。
savgol_filterでスムージングフィルターをかけているのは、横方向スライスした時に極端な外れ値があった場合に取り除けるように。 だけど私の画像は割と平坦なのでほとんど働いていなかった。
ちなみにビームストップの強度を拾わないように画像左半分[:,0:180]の範囲から最小値を拾っている。

#最初に閾値を1行あたりに決めるためのarrayを作成
threshold = np.linspace(0,1499,1500)

#0列から180列まででデータ処理をする。 polar_dataが画像を格納したndarray。
polar_data_smo= polar_data[:,0:180]

#1500行について1行ずつスムージングフィルターをかける
for i in range(1500):
  polar_data_smo[i] = savgol_filter(polar_data[i,0:180],11,4)

#閾値に1行ごとの最小値を格納していく
  threshold = np.nanmin(polar_data_smo,axis=1)

というわけでこれで閾値が取得できた。
実用的にはthresholdから多少値を引いてあげて余裕をもたせても良いかもしれない。 拾いたい値がどの程度通常の値と離れているか次第。

例外値をどうするか

均一な画像の場合

私の例はそうではないのだけど、均一なデータの場合はNANに値を変えてしまうのが楽。 均一データは平均値で物が扱えるので、平均を取るときにnanmeanなどを使えば良い。

arrayの中である値より小さな値を探す処理はnumpyのwhereが便利だと思う。

polar_data = msk_small(img2,origin,polar_data,threshold)

#閾値以下の値をNoneに変える関数
def msk_small(img2,origin,polar_data,threshold):

#1行ずつ閾値より小さな値を探してNoneを代入していく
 for i in range(1500):

#whereを使って閾値より小さな値を探す
  polar_data[i,np.where(polar_data[i,0:360]<threshold[i])] = None

#データをPILのImageで画像に出力してうまく処理できているか確認
  img = Image.fromarray(polar_data)
  img.save("test.tif")
  return polar_data

不均一だけど対称的な画像の場合

私の例の画像はこの例。
対称的だから例外値のところを使わなければ良いのだけど、ちょっと例外値の場所の周りも使いたい事情がある場合。
とりあえず最小値をthresholdに取得してあるので、それを流用して最小値で埋めてみる。 見た目的には多少マシになる。

 polar_data[i,np.where(polar_data[i,0:360]<threshold[i])] = threshold[i]

というわけでできあがった図は下のような感じ。 左側が修正後の画像。
ぱっと見はそんなに悪くはないような気もするけれど。 並べてみればまだまだはっきりとわかる。
まあ絵としては別にいいけれどデータ解析には使えない。

 

ついでにこれだとビームストップの下に特徴(ピーク)があるような場所は全然ダメ。
やっぱり適当に対称の場所をフィットしてそれを強度を合わせるように持ってきた方が良いのか。 しかしあんまりごちゃごちゃ処理するのもこういう画像処理としてはやりすぎかな。

ビームストップの位置を変えて2回データを取るなど、外れ値を作らない努力をする方が幸せかもしれない。

まあこういう処理でうまくいくような画像もきっとあるのだろう。 きっと。

不均一で何の規則もないような画像

というのもちょっと考えてみたけれど試していない。 そもそもこういう場合だと、例外値の取得がまずもって難しそうだし。 ちょうど良い画像の例もみつからなかったので諦めた。

というわけで何やら失敗談の投稿になってしまった。 せっかく書いたので投稿はしておくが後でもう少し取り組むチャンスがあれば修正・加筆するかもしれない。

何かこういう画像処理が簡単にできるパッケージ・ライブラリなどをご存知の人がいたら教えていただけるとありがたい。

関連記事

pythonのまとめ

D

鶏ささみ肉とブロッコリーの醤油炒め [簡単中華]

[概要]

鶏胸肉とブロッコリー炒め

意外と鶏モモが高いのは日本だけで、ヨーロッパとかアメリカだと胸肉のが高い。 日本で鶏モモが高いってのは人気の影響なのでしょうかね。
日本人は口が渇き気味だからモモ肉のが好きなのかな。 っても中国人も結構胸肉が好きだから不思議。 私はやっぱり鳥はモモが美味しいと思うんだけどなあ。

前置きが長くなった。 やっぱり我々日本人が胸肉を美味しく食べようと思うと少し工夫というか手間が必要に感じる。 このレシピはささみを使っているけれど、胸肉でもそんなに変わらない。

[調理時間]

30分くらい

[準備するもの]

2人前ほど

ささみ肉の準備

鶏ささみ  200gくらい

A 調理酒 大さじ1から2
A 醤油  大さじ1
A ごま油 大さじ半分
A 生姜  1片
A 片栗粉 大さじ1

ブロッコリー

ブロッコリー 一房 上の写真くらいあれば良い。 サイズしだいで適当に。

[手順]

1. ブロッコリーの下ゆで用のお湯を沸かしておく

2. ささみ肉は削ぐように細切りに

3. 切ったささみ肉と調味料Aを混ぜて漬けておく。 生姜は千切りに。

ささみを調味料に漬け込む

4. ブロッコリーを下ゆでする。 沸騰したお湯にちょろっと塩を振って3分くらい茹でる。 時間はブロッコリーのサイズ次第で調整。

ブロッコリーの下ゆで

5. 漬け込んでおいた鶏肉を炒める。 中にある程度しっかり火が通るまで。 5分も炒めれば十分だとは思うけど、こちらも鶏肉の薄さ次第で調整。 一度鶏肉はお皿にあげる。

ささみ肉を炒める

6. 油を大さじ1ほど引いて今度は茹でておいたブロッコリーを炒める。

ブロッコリーを炒める

7. ブロッコリーが温まったら鶏肉を戻して一緒に炒めて味をなじませる

鶏肉を戻して一緒に炒める

8. 味見をしながら塩で最終調整して完成!

[雑感]

  • ちょっと面倒くさいけどやっぱりブロッコリーは下ゆでした方が良い
  • ちょっと面倒くさいけどやっぱり鶏肉は最初に別に炒めておいた方が、炒め加減の過不足がなくて良い
  • 鶏肉の調味料で十分スーピーになるとは思うけど、乾燥が気になる人は最後に酒を足しても良い
  • ブロッコリーじゃなくてピーマンとかでも美味しい
  • 私はそれでももも肉のが好きだけど、意外と胸肉のが良いと言う人もいる。 うちの嫁とか

関連記事

自炊レシピのまとめ

D

 

白菜の黒酢炒めのレシピ [簡単中華]

[概要]

白菜の黒酢炒め

白菜を中華黒酢で炒めるだけ。 簡単な割に美味しくて好きな料理。 白菜は酸味と相性が良い。 ご飯が進む一品。

[調理時間]

15分以内

[準備するもの]

2人前くらい

白菜・にんにく・鷹の爪

白菜    中サイズ4枚くらい

にんにく  1片
鷹の爪   1本
調理油   大さじ1以上

中華黒酢

塩     小さじ1/4くらいから調整
中華黒酢  大さじ1くらいから調整
(写真のようなちょっと味付きの黒酢。 普通の黒酢を使う場合は、少々砂糖を足せばよいと思う)
酒     大さじ1くらいから
水     最後に水分調整

[手順]

1. 白菜を切る。 どんな切り方でも良いけど。 私は炒め物にするときは横に3−4cmくらいに切ってから、縦に5mm幅くらいの細切りにするのが好き(した写真参考)。 葉っぱは少し大きめにざっくり切っておくと仕上がりにたれが絡んで美味しい。

2. にんにくを切る。 こちらも私は縦の細切りが好き

3. それから鷹の爪を半分に割って種を捨てておく

白菜とにんにくを切る

3. 調理油をフライパンに大さじ1くらい投入。 中華炒めは油たっぷりの方が美味しいけれど、健康と相談しつつ。 それからにんにくと鷹の爪を弱火で炒める

にんにくと鷹のツメ炒め

4. 十分香りがたったら強火にして白菜の茎投入

白菜の茎を炒める

5. 2、3分で茎が透き通って柔らかくなってきたら葉っぱも投入。 葉っぱを入れたら塩を早めに振っておくとすぐに葉っぱがしんなりするので楽

白菜がしんなりするまで炒める

6. 全体にしんなりしたら黒酢を大さじ1くらい投入

黒酢を投入

7. 最後に調理酒と水で水分量の調整をする。 私は結構シャビシャビが好きなので結構いれる。 ただし塩分などの味の調整はする必要あり。

8. 最後にアルコール分が飛ぶくらい炒めたら完成!

[雑感]

  • 酸っぱい白菜は正義
  • 他の野菜でも美味しいけど黒酢炒めなら白菜かな
  • 色合いが気になるなら赤パプリカとかを足しても良い

関連記事

自炊レシピのまとめ

D

豚リブ肉のブラックビーンソース蒸し [簡単本格中華]

[概要]

豚リブのブラックビーンソース蒸し

とても好きな中華料理の一つ。 アメリカ時代に通っていた中華料理屋でよく注文していた料理。 市販のブラックビーンソース(黒豆ソース)を買ってしまえば自分で調理するのも難しくない。
やはりちょっと見た目を良くするのが難しいのが難点。

[調理時間]

肉の漬け込み時間 60分くらいから
調理時間     20分
蒸し時間     20分くらいから

[準備するもの]

リブ肉

ブラックビーンソース

豚のリブ肉       300g、写真くらいのサイズに切ってあると良い

A 市販のブラックビーンソース 大さじ1−2
上の写真のブランドのものは世界中どこでも手に入るんじゃなかろうか。 美味しいのでオススメできる。
A 生姜            一切れ
A ごま油           大さじ1
A サラダオイル        大さじ1
A 片栗粉           大さじ1
A 酒             大さじ1

分葱          仕上げにお好みで

[手順]

1. 豚リブ肉を鍋などに貼った水に入れ火にかける。 下ゆでというかリブ肉の水洗。 水から沸騰させることで綺麗にリブ肉を洗うことができるそうな。

リブ肉を下ゆで

2. 沸騰したらお湯をすててリブ肉を軽く水で洗う。

3. 冷めるまでまってからリブ肉とAの調味料をジップロックなどの袋に入れてよく揉み込む。 1時間も漬けておけば十分美味しいと思うけど、長くすればもっと味がしみる。

袋に調味料とリブ肉を詰める

4. 耐熱皿にあけて蒸し調理。 私は最近はお手軽にできるので炊飯器蒸しをよく使っているけど、もちろん蒸篭と釜やフライパンを使ってしっかり蒸してもよい。

炊飯器でリブ肉を蒸す

5. 20分から30分蒸したら出来上がり。 肉の蒸し料理は調理しすぎにはなりにくいので、火さえ通っていれば時間は適当でも大丈夫。 蒸篭を使ってる場合は水が無くなっちゃわないかだけ気をつける必要はあるが。

6. お好みで分葱などをのせて完成!

[雑感]

  • とても美味しい
  • 中華レストランでもメニューにあったら美味しいのでオススメ
  • 市販のソースが手に入れば味にそうそう間違いはない
  • ガーリックが結構強いので匂いが気になる日にはちょっと
  • ソースの片栗粉はなくてもよいけど、あるとソースが固まって味が強くなる

関連記事

自炊レシピのまとめ

D

フィンランドで生後9−10ヶ月 〜著しい身体的成長

早いもので私たちの息子も9ヶ月になった。 この時期は身体的な成長が著しい。 私たちの場合、ちょっと遅れていたおすわりを始めたかと思うといつのまにか安定して座れるようになっていた。
そのすぐ後には立ち上がる練習を始めたかと思うと、しばらくしたら立ちあがれるようになっていた。

この投稿ではそんな身体的な成長などを中心に書いていきたい。 いつも通りフィンランドでとタイトルに入れたもののフィンランド情報は特にない。 ただの日記。

手を突かないでおすわり

時折自分でおすわりを練習するようになったのは7ヶ月前後だったか。 安定して手を突かずに座れるようになったのは生後8ヶ月の少し前。
私たちの息子は少し頭が重そうなので、座った状態で安定するのが大変だった模様。 今では座って両手を使って遊べるようになった。

立ち上がりの練習中

生後8ヶ月と10日でベッドの中で柵につかまりながら立ち上がる様子を見せた。 その1週間後にはベッドの中でしっかりと立ち上がれるようになっていた。
もう少し不安定なソファーなどで立ち上がれるようになったのは、さらにその1週間後くらい。
それからちょろちょろと横移動を始めたのは生後9ヶ月前後。
だいたい1−2週間おきに進化を見せるようだ。

断乳プラス夜の連続睡眠

深夜の授乳を基本的にストップしたのが生後8ヶ月と10日。
やっぱり深夜に起き出しはするのだけど、頑張って授乳なしで寝かしつける努力中。 成功しないこともあるけれど、少しずつ進歩はしているかな。 基本無理しない方針なので、とてもゆっくり進歩中。

人見知りスタート

なんだか人見知りしている。 まず私がヒゲを剃ってメガネを変えると、知らない人だと思って泣こうとしていた。 最近では少し慣れたのか大丈夫になったけれど。
それから図書館など外に遊びに行く時も、知らない人がいると警戒している模様。 こちらも何回か通っていたらだいぶ慣れてきた模様。
10ヶ月の後半くらいからまたあまり人見知りしなくなった。 というか外に出慣れたのかもしれない。

初めての下痢

9ヶ月に入り下痢をした。 そんなにひどくなかったし元気だったので様子見。 3、4日で治った。 ロタのワクチンは食べたのだけど、お腹を下すのは止められない。

軽い下痢はそれなりによくあるのかしらね。

椅子におすわりで離乳食

9ヶ月の始め、食事のために赤ちゃん用の椅子を購入した。 例のごとくセカンドハンドショップで格安。

椅子があると膝に座らせたまま食べさせるよりもだいぶ楽。 子供の方も食べやすそうにしている。 もう少し早めに手に入れておけば良かったと思った一品。
一方で手が自由になったので、容器やスプーンなどに手を伸ばすようになった。 ちょっとこぼしそうになったりするので対応が大変。 自分で食べてみたいのかしらね?

というわけでフィンランドでの9・10ヶ月目の育児体験でした。 11ヶ月目から誕生日の前まで、嫁と一緒に中国に里帰りすることになったので私はしばらくお別れ。
といっても今の時代テレビ電話があるからそんなに離れている感じもしないけれど。

関連記事

1. 海外出産・海外育児のまとめ

D

トマトと卵の中華スープのレシピ [簡単中華]

[概要]

トマトエッグスープ

中華の基本トマトエッグ。 中国人はトマトエッグを料理しながら、料理の腕をあげるやらなんやら。
炒めものの方が有名だけど、スープもよく作るそう。 簡単な割にご飯と良くあって美味しい。

[調理時間]

10分

[準備するもの]

トマトエッグスープの材料

トマト  1個
卵    1個
干し筍  3、4本 (あれば美味しいけどなくても大丈夫)
水    300ml程度

塩    小さじ半分程度から調整

[手順]

1. トマトを8つ切りに切る

2. 乾し筍を小さく切っておく

3. 卵は白身を切るようにしっかり溶いておく

4. 水を張った鍋に1・2を投入する

水にトマトと干筍を投入

5. 強火で沸騰するまで加熱する

トマトを入れた鍋を沸騰

6. 一気に卵を入れてお箸でぐるっとかき回す

7. 完成!

卵を投入

[雑感]

  • 写真のタイプの干筍が手にはいればとてもgood
  • 搾菜とかを使っても美味しい
  • 何もなかったら塩だけでも美味しいけど
  • 簡単に1品足したいときに便利なスープ

関連記事

自炊レシピのまとめ

D

日本で時折り起こる研究不正疑惑への雑感

旬は過ぎたけど京大のips細胞研究所の研究不正が話題になっていた。 サプリメンタリーを含めて論文のほぼ全ての図表が対象ということ。 なので残念だが意図的な改竄なのだろう。

表に出てこない研究不正というのもあるだろう。 しかしこういった生命科学の分野は成果や雑誌が派手になりやすいもの。 インパクトが大きい反面比較的バレやすい分野なのかもしれない。 それだけ期待をされている分野ともいえよう。

私のいる分野は正式だろうが不正だろうがあまり注目されない分野なのだが、この機会にせっかくなのでちょっと研究不正について考えてみることにした。

研究不正が起こるのはなぜか?

最近あまり見ないけれど、きっとこういう改竄もあるのだろうね。 資金出すから都合の良いデータ出しといて的な。
網羅しているかは知らないが、発覚した研究不正の一覧についてはwikiでみることができる[1]。

研究者は研究資金の提供先から影響されちゃいけないのだ。

研究者の不安定な将来

最近はむしろこっちが多いのではないだろうか。 やっぱりなんだかんだで研究者の不安定身分ってのは大きいよ。 特に日本では。
某東大の教授がおっしゃっていたけれど、日本ではある年齢域を超えるとそれに合わないポジションが取れなくなる。 だからなんでも良いからさっさとポジション取れと。
そういうシステムを変えることのできる立場の人が、学生をそっち方向に後押ししてるんだからシステムが変わることは当分ないはず。

現状そういう状態なのだからポスドクや任期付助教は、できるだけ早くにやめたいというポジション。 それではじっくりと腰を落ち着けて研究に邁進することも難しい。
年が行ってようが行ってまいが能力のある人がふさわしいポジションを取れる制度ならば焦ることもない。 むしろしっかりとポスドクや任期職中に技術・知識・人脈を広げることに集中できるだろう。 逆に実力に合わないポジションを早々に掴んでしまうのもなかなかにして不幸なことだろうしね。

私もポスドク期間がだいぶ長いが、次のステップに進んでも大丈夫かなと思えたのはつい最近だ。 私はいろいろと他の問題も抱えているから、実際に次のステップに進めるかどうかはわからないがそこは今は問題じゃない。
数年前に運だけで次のステップに進んでいたら、きっとうまくいかなかっただろうなと思うのだ。

それからドロップアウトした研究者の受け皿ってのもはっきりしていない。 というかあるのかな? 例えば企業が研究職のような特化した人たちを中途で上手に採用するのにはそれなりに経験とノウハウが入りそう。 ヨーロッパ・アメリカは少なくとも求人は見るけれど、日本はどうなのだろう。
もちろんボスのコネとかで企業に行く人もいるし、自力で何かしら見つけて転職する人もいる。 とはいえどこに行ったかわからない人もいるのだからもったいない。
なんだかんだでphdまでとる才能か努力を見せた研究者。 そんな人材をうまいこと再利用できる仕組みってのがあっても良いのじゃないかとも思う。
わかりやすい逃げ先があれば不正してまで待遇の良いわけでもないアカデミックな研究職に執着することもないだろう。

だいぶ脱線したので話を戻す。 そんな不安定な状況下で一発当たれば大きい研究テーマをやっていたとする。 後1・2個良いデータがあるだけでハイインパクトな雑誌に投稿できるってなったら、何かしら悪魔が耳元で囁いちゃう人もいるんじゃないか。 特に職が期限切れ間近だったらね。

技術的容易性

実験研究者の場合研究不正は技術的には難しくない。 理論研究の研究不正ってあったのかしら?

実験の場合数値の改竄なんて追試をしなきゃ分からないだろう。 近年だと得られた図を適当に捏造するなんてのも別に難しいことではない。 そういった画像改変スキルなどは別の職種ではむしろ求められるものなんじゃないだろうか。

そもそも論文を書くときに生データをそのまま載せることはまずない。 生データってとってもわかりにくいから。 そんな生データを綺麗にみせるために色々と工夫する必要がある。
そんなデータプロセスはデータを綺麗に見せつつも、科学的本質を変えないようにというところに苦労するものなのだ。 これには理論的な補正、偶発的機械的エラーの修正、バックグラウンド除去、スムージングなどの操作が含まれる。

しかしあまりにこういったデータプロセスに慣れすぎると、思わず手が滑ってデータを綺麗にしすぎた! なんて不正もあるのでしょうかね。

内部発覚の可能性も低い

一番気がつく可能性が高いのは直接の研究の上司だろう。 しかし同じ目標を目指して苦労してデータを集めていて、ちょっと都合のいいデータが出てきたとする。 それを疑うことのできる研究者というのはあまりいないかもしれない。
というかいちいちデータの捏造を疑ってくるボスとか嫌だし。 解析ミスを疑う人はかなりいるので、その過程でふと改竄を見つけるなんてことはあるのかな。

シニアオーサーが直近のボスじゃない場合はそこでも発覚のチャンスありか。 シニアオーサーは結構しっかり読む人が多いと思う。
ここでもやはり捏造を疑うってよりは、何かおかしいから追試したらってくらいで言われるのだろうけど。

それ以外の著者が気づくかというと微妙だと思う。 今回の論文も10人も著者がいるらしいけど、逆にしっかり読んでる人が少ないって可能性もある。
自分の実験と結果考察が絡んでいない場所までがっつりと読み込んでくれる。 そんな時間のある素敵な共同研究者って残念ながらあまりいない。 たまにいると逆に面倒臭かったりもするけれど。

雑誌の査読を通り抜けちゃう可能性も結構ある

さていよいよ論文をどっかの雑誌に投稿するとする。 科学論文は最初に雑誌のエディターが読む。 論文が新規性があってその雑誌にふさわしいかどうかを判断するのだ。
ここが通常の論文を通す時には意外と難しいところなんだ。 しかしエディターはよっぽどあからさまでなければ研究不正かどうかなんて考えもしないだろう。
あからさまならその前段階ではじかれているだろうし。 というわけで改竄されたような派手論文はむしろ通り抜ける可能性が高い。

エディターの審査を通り抜けるといよいよ同じ分野で学ぶ研究者の査読(論文が正しい方法でデータをとって、正しく解釈しているかのチェック)へと回ることになる。
査読に当たる研究者は著者からも推薦できる雑誌が多い。 それから査読をしてほしくない研究者を数人選ぶこともできる(とても同じ分野を競っている同業研究者など)。
大概は推薦から一人か二人、雑誌独自に選んで一人か二人といった感じで査読者が選ばれるだろう。

さて。 分野しだいだろうけど完全に同じことをやっていて、かつ公正に評価してくれる研究者ってのはなかなかいない。
そうすると同じテーマをやってるけれど解析手法は違う人。 同じ解析手法だけどちょっと違うタイプのサンプルを使ってる人。 そんな人たちへと査読が回ることになる。
そうなると査読が回ってきた研究者は、自分の専門でわかるところを中心に読むことになる。 そのため自分の専門以外の部分へのチェックは甘くなることもあるだろう。
私自身が査読した経験でも似たような事例がある。 かなり考察の甘い論文だったので、かなりきつめの修正を要求したことがあったのだ。 だがその時のもう一人の査読者は4行くらいの短文。 しかも問題なしの良い論文だとのことで終わっていた。
翻って自分が論文を投稿する場合でもだいたいそんな感じだ。 一人か二人は真面目に読みこんでくれることが多いけど、読んだか読んでないかわからないような返答が混ざっていることもあるものだ。

それから査読をするにしても査読者は研究不正を前提に論文を読んだりはしない。 なのでむしろデータが綺麗な不正論文は、ここをあっさり通り抜けてしまう可能性が高いとすら言える。

真面目に追試する時間のある人があまりいない

さて一旦査読者の審査を通り抜けると、論文が出版されることになる。 ここまできたら発覚の最後のチャンスだ。
少しでも興味を持たれる内容の論文だった場合、どこかしらのグループが再試や実験手法を応用しようとするかもしれない。 今回のケースはこの例だろうか?
なので興味を持たれない不正論文は単に埋もれていくんじゃないだろうか。

ちょうど私も今ある論文の実験の追試をボスに頼まれてやっている。 これがなかなかにして面倒臭い。 適当に書いてあることも多い実験手法を、一つ一つと再現していかないといけないからだ。
完全に実験をコピーできたと思っても何かしらその論文の手法と異なるところがあるかもしれない。
というわけでぱっと追試して同じ結果が出なかったとしても、研究不正という言葉は浮かばない。 手法の細かい条件設定や何かしら書き洩らされた描写があるんじゃないかなど、チェックすることがたくさんあるからだ。

何度か追試をして同じ結果が出ない場合、いよいよ論文の著者に連絡することになるだろう。 論文を投稿すると一人か二人連絡担当の著者を決めているはずだ。 論文を読んでも不明なことは彼らにメールして確認することができるのだ。 そこで書き落とされた手法がないかを確認する。
そこでいろいろと言われたら一つ一つチェックしていくことになる。 それでも再現できないとなったとき、初めてどうなってんだってことになる。

この追試の過程ってかなりの時間がかかる。 ぱっとやって再現しなかったら諦めちゃう研究者もいるんじゃないかな。 よっぽど結果に興味があるだとか、その方法をどうしても応用したいとかじゃなければね。

研究不正を防ぐには

実験ノートよりもパソコンをなんとかしたい所

よく言われる実験ノート。 数年前の理研での一件の後、大学での実験ノートが厳しくなったとの話を聞いた。
しかしこれは今の時代あまり効かないんじゃないかな。 京大でも実験ノートを使うように指示していたというし。 手書きのだから不正できないっていうのはどうなんだろうかね。 不正するくらいやる気のある人だったら、そこの隠蔽もしっかりするだろう。
また硫酸など試薬をこぼして読めなくなった実験ノートがあったとして、実際その間の取得データ全部廃棄するのかしら。 まあ毎日スキャンをとって保管するようにすれば良いのか。 しかしそれ用の職員を雇うんでもなければ数多い研究者に対してコストが高そう。

やはり今の時代普通はパソコンでデータをまとめるのだから、こちらの透明性を高めるような努力があった方が良いのではないだろうか。
仕事は個人のパソコンの使用を禁止して公的パソコンだけで作業するようにするとか。 ポスドクからは良いけど学生はちょっと大変かな。 でもやっぱり不正はパソコンの中で起こるのだから、パソコンをなんとかするのが一番だよね。

そういった意味では実験装置も変えた方が良いのか。 手書きでデータを取っていくような装置は廃止して、パソコンに自動出力するような装置に変えていく。
生データもしばらく装置本体にも保管されるようにしておけばなお良い。

しかしなんだかギスギスした感じで嫌な感じになるね。 しょうがないのかな。

研究者の待遇改善

これは研究者に限らずだけど。 それなりに努力が報われる社会が良いよね。 努力の方向性が間違っていたとしても。 そういった方向性ってボス次第でどうしようもないこともあるし。

それからドロップアウトに優しい社会の方が、むしろドロップアウトが少なくなるんじゃないかな。 特に頑張って、頑張った上でドロップアウトする人たちには、それなりに良い代替の道が用意されていてほしいもの。

ここでは具体的な話には踏み込まないけど、こういった対策の方が優しい感じがして良い。

アメリカでの印象なんだけど、研究者ってそんなに人気じゃない。 たくさん勉強しなきゃいけないし。 科学は多くいる中国人・インド人を中心としたphdやポスドクに支えられている部分がある。
アメリカ人の優秀所の人たちは生来の科学好きを除けば、もっと給料や待遇の良い道を選んでいるのじゃないか。 ちなみにアメリカの研究者の待遇は悪くなくて、他の仕事の方が努力に対するコストパフォーマンスが良いというだけだけど。

日本だと研究者の人気がないわけではなさそう。 研究職が若い人たちに人気みたいな記事を最近どっかで読んだ。
しかしそういった職業に能力のある人たちに定期的に来てもらうには、それなりの給料や安定した生活を保証する必要がある。 そうでなければ好きでやっている以外の能力ある人たちは別の仕事に行ってしまうよね。 実際理系から文系就職する人ってとても多いし。
アメリカみたいに外人部隊を雇うってのなら良いけれど、日本っていう国はあまり向かないと思うんだ。

研究不正のタイプ別対処

こういう不正の対策に対応するのって、やはりお偉い先生方ってことになるのだろう。
印象先行のところはあるかもしれない。 だがお偉くなっている年代の人たちが自分で研究不正をする場合って金目当てだったり名誉目当てだったりと人生の追加目的って感じがする。 そういった不正に対する対策だったらなんとなくうまいんじゃないかなって。

今回みたいな若手の不正って、先が見えなくて切羽詰まってみたいなところがあるのじゃないか。 そいういのって上の人たちには頭ではわかっても感覚ではわからないんじゃないだろうか。 もちろん状況は理解できるんだろうけど、経験してない人にはそれがどれだけ切実かなんてわからないもんだし。

特に今の30代くらいの人たちって経済が悪化し続けるなかで生きて来た世代。 若い間にどんどん成長する社会を経験してきた人たちとはそもそも精神性からして違いそう。

こういった世代格差って研究分野じゃなくてもよくある。 どちらが悪いってんではなくて違うってだけなんだけど。 自分の常識は自分の成長過程において形成されるものってことで、そんな自分の常識打ち破るのって結構なエネルギーいるよね。

機械的論文審査

またまた脱線してきたので話を戻す。
論文不正は今の時代人に判定させるよりも機械的に判定させた方がよいのでは。 図表やデータにおかしなところがないか読み込ませて判定するようなソフトがあれば良い。 作られたデータに綺麗すぎるなどの特徴があればだけど。 それなりにあるんじゃないかな。
AI研究者の人たちには是非とも頑張って欲しいところ。 そっちで不正が起こってしまったりするかもしれないが。

ソフト自体は別に正確じゃなくても良いんだ。 怪しげだったら追試データを求めるくらいのゆるい審査をすれば良い。 それくらいならみんな嫌がらずに読み込ませるのじゃないか。

研究不正が本当に何か将来に繋がるとも思わないけれど、やったもの勝ちの世界になってしまうのも何か違うよね。

まとめ

*研究不正は技術的に簡単だしバレない可能性も高い

*不正を止めるよりは不正の温床となる原因を取り除こう

*不正審査・不正対策をするなら人的よりも機械的な対策を

[1] 「科学における不正行為」『フリー百科事典 ウィキペディア日本語版』(http://ja.wikipedia.org)。2018年1月23日 (水) 15:04更新版

D

雪菜トマト豚肉麺のレシピ [簡単中華]

[概要]

雪菜トマト豚肉麺

ラーメンと言うと気合が入ってるのはやはり日本なのだけど、中国にもお手軽なヌードルショップはたくさんある。
何と言っても安いのが一番だけど、いろいろとスープの種類があってこれが結構美味しいのだ。 一方で麺自体にはそんなに気合が入っていないことも多い。

前置きが長くなったけれど、この投稿では中国で人気の麺の一つ雪菜麺のレシピを書く。 雪菜は高菜の漬物みたいなもの。 ちょっと酸っぱめでしょっぱい漬物。 なので日本で調理するなら高菜の漬物でも代用できるはず。
漬物なので酸味の効いたスープになり、豚肉などと合わせるととても美味。 ここでは豚のひき肉、トマトと白菜と合わせたスープで。

[調理時間]

20分

[準備するもの]

*2人前くらい

フライパンと鍋

底の深いフライパン
麺を茹でる鍋

〜スープ〜

白菜   3枚くらい
トマト  1個
豚ひき肉 50g
白しめじ 半パック
雪菜   大さじ2−3 (お好みで)
水    500ml
調理油  大さじ1

〜麺〜

麺    2人前 (うどん、そうめん、ラーメンなどなんでも良い)

〜調味料〜

A 醤油  小さじ半分
A 片栗粉 大さじ1
A 生姜  薄切り1枚

B 醤油  大さじ1
B 酒   大さじ1
B 塩   小さじ1くらいから (スープの味見をしながら調整)

〜仕上げのおまけ〜

目玉焼き、分葱など

[手順]

1. 豚ひき肉と調味料Aをスプーンなどを使って混ぜる

2. 白菜は細切り、トマトは8つ切りに、それからしめじを適当に分割する

野菜を切ってひき肉を下ごしらえ

3. コンロが二つあるなら麺を茹でるためのお湯を鍋に沸かしておく。 スープが出来上がる少し前に麺を茹でておくと手早くできる

4. フライパンに油を引く

5. の豚ひき肉を炒める

豚ひき肉を炒める

6.  少し固まってきたら適当なサイズに割る

ひき肉を適当なサイズに

7. の野菜を火の通りにくい順に投入。 この場合は全部一緒でも大して変わらない

野菜を炒める

8. 雪菜投入

雪菜を投入

9. しっかり炒め合わせる

炒め合わせる

10. 水を500mlほど投入

水を500ml投入

11. 煮立ったら調味料Bを投入。 味見をしながら調整してスープの完成

12. 麺とスープを混ぜて出来上がり! お好みで目玉焼きなどを乗せて

完成

[雑感]

  • 細麺、太麺なんでも合うけど、蕎麦とかは喧嘩するかも
  • 野菜・きのこはスープに入れるようなものならなんでも美味しい
  • 肉はひき肉でなくても良いけど豚肉が合う
  • 飽きたら酢やラー油などを入れると雰囲気が変わる
  • 残り物の野菜炒めなどを流用すると、朝食とかでもぱっぱと作れる

関連記事

自炊レシピのまとめ

D

 

全豪オープンテニス2018の雑感

2018年のテニスシーズンが始まった。 昨年は最初にブリスベン国際を制したディミトロフが年間を通して活躍を見せ、最後にはファイナルまで取るという偉業を達成した。

今年のそんなブリスベン国際を取ったのは地元オーストラリアのキリオス。 今年はまさかのキリオスの年になるのだろうか。
キリオスのプレイは見てて楽しいけど安定はしてないからな。 でもブリスベンの勢いに任せて全豪オープンを取ったりしないだろうか。 昨年のディミトロフもベスト4まで進出したし。 なんて思っていたらキリオスはそんなディミトロフに負けてしまった。

残念ながら全豪オープンは時差の都合で平日はほとんど見られない。 そういうわけでEurosports playerで放送はされてはいるのだけど、今回は観戦はスキップ。 結果だけフォローすることにした。

2018年全豪オープンテニスの序盤戦

昨年に引き続き怪我がちのトップランカー達。 マリー・錦織などが残念ながらトーナメントに姿を見せることができなかった。 ラオニッチやパブリンカも怪我明けの影響で早期敗退してしまった。
一方でジョコビッチや昨年末故障を抱えてそうだったナダルが全豪オープンに間に合った。 少しずつ豪華なグランドスラムに戻りつつあるのかな。

さて序盤戦はまず日本人選手が1回戦を勝ってくれたのが嬉しいところ。
杉田が昨年末にフィーバーしてたジャックソックに勝ったのは嬉しいサプライズ。 カルロビッチに負けてしまったのは残念だけど、序盤戦のカルロビッチは運次第なところもあるからしょうがない。
これからに期待が持てそう。

西岡もコールシュライバーにフルセットでの勝利。 こちらも昨年調子の良いところで怪我してしまったけれど、その調子の良さを引き継いでいる感じだろうか。 セッピに負けてしまったけど、セッピは4回戦まで勝ち進んだのだししょうがない。
若いしこちらもこれからに期待。

その他の序盤戦は順当といったところか。 ジョコビッチが勝ち上がっている。 次のチョンヒョン戦が最初の山か。
フェデラー・ナダルが相変わらず調子が良さそうなので、やはりこの二人をどう倒すかというトーナメントになりそう。

ウイメンズの方も割と順当な様相。 その中で勝ち上がってきたなおみちゃんには是非とも頑張って欲しいところ。 ハレプに勝ってその勢いで突き進んで欲しい。

終盤に向けて今更ベスト4予想

優勝    チリッチ

準優勝   フェデラー

ベスト4  ディミトロフ・ジョコビッチ

チリッチはナダルに勝てるポテンシャルはあると思うのだよね。 ナダル強いけど。 ナダル戦で疲労しそうなチリッチだけど、なんとなくディミトロフには勝てそうなイメージ。

反対側はベルディヒを倒して調子の上がったフェデラーがティエム戦で疲れたジョコビッチを倒すと予想。 しかしジョコビッチは粘るので疲れるフェデラー。

決勝はスーパーチリッチが出てきてウインブルドンの雪辱を果たす。 なんてのも面白そうだけどさてどうなることでしょう。 チリッチかディミトロフの錦織世代にグランドスラムをとって欲しいところ。

追記:結果は以下の通り

優勝   フェデラー
準優勝  チリッチ
ベスト4 ヒョン・エドモンド

D

フィンランドで2年目に税金カードが送られてきたらすること

フィンランドで生活をしていると年明けになると送られてくるものがある。 あまりありがたくないようでもあり、大切なものでもある。 そう、税金カードだ。

税金カードに書かれていること

税金カードが送られてくると困ること。 それは英語で書かれていないこと。 フィンランド語かスェーデン語が読めない場合はちょっと翻訳に苦労することになる。
そんな時はvero.fiのWebページへ。 Webページは英語ページがある上に十分な情報が書いてある。
ちなみに税金カードに書かれているのは前年度の総所得や課税された金額など。 月ごとや2週ごとなどの給料も書かれているので逆にわかりにくい。

さて、ここで問題になるのが総所得。 外国人がフィンランドで働き始める場合には、区切りの良いところから働き始めていないことが多いと思う。
その場合1年目の給料は税務署の計算では一年分フルに出ていないことになる。 そのため2年目の税金カードはその少ない総給与情報から計算して低税額で送られてくる。 これを修正申告しないと年末に追徴課税されることになってしまうのだ。
また前年度から昇給している場合や何かしら税金減免に相当するような変化がある場合も修正申告が必要であろう。

税金カードに対してするべきこと

vero.fiにアクセスすればオンライン更新ができる。 税金オフィスに直接訪れて変更することも可能だ。

vero.fiでオンラインバンクを使った個人認証

フィンランドでこういった公的ウェブページを使う場合、まず個人認証をする必要がある。 いろいろ方法はあるけれど、外国人が簡単に使えるのは銀行認証。 働いてればまず銀行口座は作るので。 オンラインバンクのコードを使うとサクッとログインできる。

オンライン更新でやること

まずは一年の年収を入力。 私の場合だとこれは休暇分を合わせて11.5ヶ月分の給料になる。 それから月ごとの給料と税金を入力。 これは確認のためなのかな? 金額はこの頃には1月分の給与明細が送られてきているはずなのでそれを使って入力する。
年収の計算の仕方は人によって違うので部署の秘書さんに聞くとよい。 その後はつらつらと他に所得があるかどうかなどを聞かれるので素直に答えて行けば良い。 特に何もなければそのまま進行。

3ページ目まで行くといくら収入があるかといくら税金が引かれるかのまとめに入る。 私は20%くらいの所得税率だった。 なかなか。。
特に問題が見当たらなければそのまま進めていけば良い。

最後のページに行くと、税金カードを郵送するか自分でプリントするかというオプションが出る。
うちの職場の場合は自分でプリントして秘書までメールで送ってねと言われていた。 大体の職場はそういう求め方をするとは思うけど、職場次第のやり方をすれば良い。 ここをクリックすると入力情報が税金オフィスに送られる。
これだけでこの手続きはおしまい。 たぶんこういった手続きの説明は初年度に税金オフィスを訪れた時にされていたのだろう。 しかしそれを覚えている人もあまりいないだろうと思った年始の1日だった。

関連記事

1. 海外就職手続きのまとめ

2. フィンランドの移住手続き 〜住民登録・税金KELAカード

D