sapphire_graph

スナップとか雑感とかを書き連ねたもの

文字列の削り取り

IDのリストなどで,後ろの方を削りたいときがある.

例えば,Trinityをかけて,TransDecoderでアミノ酸配列にしたときなど.

 

abcdef

という文字列で,bcdだけ欲しい時,

cut -c 2-4

でいける.

変にシェル芸使うより楽.

余計なものが入っていても,エディタで消せば解決.

手元のfastaファイルをアミノ酸に翻訳して,ターゲット配列をhmmserchで釣る

手元のfastaファイルをまずはアミノ酸に翻訳.

使うのはTransDecoder.

Home · TransDecoder/TransDecoder Wiki · GitHub

だいたい読めばわかる.

2ステップで,手元ファイルを変換する.

 

TransDecoder.LongOrfs -t hoge.fa

TransDecoder.Predict -t hoge.fa

 

デフォルトだと100アミノ酸以上の配列しか作れないので,

必要に応じて,-mのオプションでいじる必要あり.

 

次に,翻訳したアミノ酸配列から,欲しい配列をとってくる.

例えば,gapdhが欲しいとする.

https://pfam.xfam.org

に飛んで,Keyword searchにgapdhと入力する.

f:id:fg750s:20180720164523p:plain

こんな感じの画面が出てくるので,試しにGp_dh_Nをクリックする.

f:id:fg750s:20180720164843p:plain

そして,Curation & modelをクリックする.

f:id:fg750s:20180720165039p:plain

downloadをクリックすればOK.

txtファイルが手に入る.

 

先程,TransDecoderで翻訳したファイルがあるディレクトリにこのtxtファイルを移動して,

hmmsearch Gp_dh_N.hmm.txt hoge.fa.transdecoder.pep |less

とすればOK.