sapphire_graph

スナップとか雑感とかを書き連ねたもの

手元のfastaファイルをアミノ酸に翻訳して,ターゲット配列をhmmserchで釣る

手元のfastaファイルをまずはアミノ酸に翻訳.

使うのはTransDecoder.

Home · TransDecoder/TransDecoder Wiki · GitHub

だいたい読めばわかる.

2ステップで,手元ファイルを変換する.

 

TransDecoder.LongOrfs -t hoge.fa

TransDecoder.Predict -t hoge.fa

 

デフォルトだと100アミノ酸以上の配列しか作れないので,

必要に応じて,-mのオプションでいじる必要あり.

 

次に,翻訳したアミノ酸配列から,欲しい配列をとってくる.

例えば,gapdhが欲しいとする.

https://pfam.xfam.org

に飛んで,Keyword searchにgapdhと入力する.

f:id:fg750s:20180720164523p:plain

こんな感じの画面が出てくるので,試しにGp_dh_Nをクリックする.

f:id:fg750s:20180720164843p:plain

そして,Curation & modelをクリックする.

f:id:fg750s:20180720165039p:plain

downloadをクリックすればOK.

txtファイルが手に入る.

 

先程,TransDecoderで翻訳したファイルがあるディレクトリにこのtxtファイルを移動して,

hmmsearch Gp_dh_N.hmm.txt hoge.fa.transdecoder.pep |less

とすればOK.

vimで^M(改行コード)を一括削除

テキストファイルをゴニョゴニョしているときに,

^M

が入っていて困ったことがあったので,備忘録として.

 

vimにて

:%s/検索文字列/置換文字列/g

を改変して,

:%s/^M//g

ただし,^Mは制御コードなので,

cntl+vを押して^を入力し,cntl+M

と入力する.最初できなくてハマった.

vimで指定した文字列を含む行を消す

vimのメモ帳

 

指定した文字列を含む行を削除するには

 

:g/消したい文字列/d

 

でOK.

 

逆に,指定した文字列を含まない行を削除するには,

 

:v/残したい文字列/d

 

で.

trinityのコンパイルにコケる

ログをみるとgccだが何かがおかしいらしい.

 

ということで,

export CXX=g++-4.9

としてから

make

して終了.

 

昔,gccをいじったことがいけなかったのかなー.