• 演讲稿大全
  • 辩论技巧
  • 演讲口才
  • 口才技巧
  • 口才训练
  • 谈判技巧
  • 朗诵技巧
  • 练声方法
  • 当前位置: 工作范文网 > 口才 > 练声方法 > 正文

    生物信息学实验报告[共24页]

    时间:2020-11-23 09:44:10 来源:工作范文网 本文已影响 工作范文网手机站

    PAGE / NUMPAGES

    生物信息学实验报告

    姓名:__黄栋_______

    学号:___030940119____

    指导老师:___宋晓峰____

    南京航空航天大学

    2011年11月

    实验一 生物信息数据库的检索

    实验目的:

    1.了解生物信息学的各大门户网站以及其中的主要资源。

    2.了解主要数据库的内容及结构,理解各数据库注释的含义。

    3.以PubMed为例,学会文献数据库的基本查询检索方法。

    实验内容:

    (1)国际与国内的生物信息中心

    国际NCBI、EBI、ExPASy,EMBL、SIB、TIGR以及国内CBI、BioSino网站的熟悉及内容的了解。

    核酸序列数据库:genbank/EMBL-bank/DDBJ

    NCBI网址: HYPERLINK "/"/

    EBI网址: HYPERLINK "http://www.ebi.ac.uk/"http://www.ebi.ac.uk/

    EMBL网址: HYPERLINK "http://www.ebi.ac.uk/embl"http://www.ebi.ac.uk/embl

    蛋白质序列数据库:

    Swiss Prot 、ExPASy网址: HYPERLINK "/"/

    Uniprot网址: HYPERLINK "/"/

    蛋白质结构数据库:

    PDB网址: HYPERLINK "/pdb/"/pdb/

    (2)检索练习:

    The spike protein of SARS-Corona Virus在NCBI中的核酸记录序列:

    LOCUS CS244439 3897 bp DNA linear PAT 17-JUL-2006

    DEFINITION Sequence 3 from Patent WO2005118813.

    ACCESSION CS244439

    VERSION CS244439.1 GIKEYWORDS .

    SOURCE SARS coronavirus

    ORGANISM HYPERLINK "/Taxonomy/Browser/wwwtax.cgi?id=227859"SARS coronavirus

    Viruses; ssRNA positive-strand viruses, no DNA stage; Nidovirales;

    Coronaviridae; Coronavirinae; Betacoronavirus.

    REFERENCE 1

    AUTHORS Altmeyer,R., Nal-Rogier,B., Chan,C., Kien,F., Kam,Y.W., Siu,Y.L.,

    Tse,K.S., Staropoli,I. and Manuguerra,J.C.

    TITLE Nucleic acids, polypeptides, methods of expression, and immunogenic

    compositions associated with sars corona virus spike protein

    JOURNAL Patent: WO 2005118813-A2 3 15-DEC-2005;

    INSTITUT PASTEUR (FR); Hong Kong Pasteur Research Centre Limited

    (CN)

    FEATURES Location/Qualifiers

    source 1..3897

    /organism="SARS coronavirus"

    /mol_type="unassigned DNA"

    /db_xref="taxon: HYPERLINK "/Taxonomy/Browser/wwwtax.cgi?id=227859"227859"

    HYPERLINK "/nuccorefrom=44&to=3847"CDS 44..3847

    /note="unnamed protein product"

    /codon_start=1

    /protein_id=" HYPERLINK "/proteinCAJ56183.1"

    /db_xref="GI

    /translation="MFIFLLFLTLTSGSDLDRCTTFDDVQAPNYTQHTSSMRGVYYPDEIFRSDTLYLTQDLFLPFYSNVTGFHTINHTFGNPVIPFKDGIYFAATEKSNVVRGWVFGSTMNNKSQSVIIINNSTNVVIRACNFELCDNPFFAVSKPMGTQTHTMIFDNAFNCTFEYISDAFSLDVSEKSGNFKHLREFVFKNKDGFLYVYKGYQPIDVVRDLPSGFNTLKPIFKLPLGINITNFRAILTAFSPAQDIWGTSAAAYFVGYLKPTTFMLKYDENGTITDAVDCSQNPLAELKCSVKSFEIDKGIYQTSNFRVVPSGDVVRFPNITNLCPFGEVFNATKFPSVYAWERKKISNCVADYSVLYNSTFFSTFKCYGVSATKLNDLCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNYNYKYRYLRHGKLRPFERDISNVPFSPDGKPCTPPALNCYWPLNDYGFYTTTGIGYQPYRVVVLSFELLNAPATVCGPKLSTDLIKNQCVNFNFNGLTGTGVLTPSSKRFQPFQQFGRDVSDFTDSVRDPKTSEILDISPCSFGGVSVITPGTNASSEVAVLYQDVNCTDVSTAIHADQLTPAWRIYSTGNNVFQTQAGCLIGAEHVDTSYECDIPIGAGICASYHTVSLLRSTSQKSIVAYTMSLGADSSIAYSNNTIAIPTNFSISITTEVMPVSMAKTSVDCNMYICGDSTECANLLLQYGSFCTQLNRALSGIAAEQDRNTREVFAQVKQMYKTPTLKYFGGFNFSQILPDPLKPTKRSFIEDLLFNKVTLADAGFMKQYGECLGDINARDLICAQKFNGLTVLPPLLTDDMIAAYTAALVSGTATAGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKQIANQFNKAISQIQESLTTTSTALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQAAPHGVVFLHVTYVPSQERNFTTAPAICHEGKAYFPREGVFVFNGTSWFITQRNFFSPQIITTDNTFVSGNCDVVIGIINNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYVWLGFIAGLIAIVMVTILLCCMTSCCSCLKGACSCGSCCKFDEDDSEPVLKGVKLHYTGPGGDYKDDDDK"

    ORIGIN

    1 ctatagggcg aattgggtac cgctagcgga tccgcgcgcc accatgttta ttttcctgct

    61 gtttctgact ctgaccagcg gcagtgacct ggaccggtgc accacttttg atgatgtgca

    121 ggctcctaat tacactcagc atacttcctc tatgaggggc gtgtactatc ctgatgaaat

    181 ttttagatcc gacactctgt atctgactca ggatctgttt ctgccattct attctaatgt

    241 gacaggcttt catactatta atcatacctt tggcaaccct gtgatccctt ttaaggatgg

    301 catctatttt gctgccacag agaagtccaa tgtggtgcgg ggatgggtgt tcggctctac

    361 catgaacaac aagtcccagt ccgtgattat tattaacaat tctactaatg tggtgatccg

    421 agcctgtaac tttgaactgt gtgacaaccc attctttgct gtgtctaagc ccatgggcac

    481 acagacacat actatgatct tcgataatgc ctttaattgc actttcgagt acatctctga

    541 tgccttttcc ctggatgtgt ccgaaaagtc cggcaacttt aagcacctgc gagagtttgt

    601 gtttaagaat aaggatggct ttctgtatgt gtataagggc tatcagccta tcgacgtggt

    661 gcgcgatctg ccttctggct ttaacactct gaagcctatt tttaagctgc ctctgggcat

    721 taacattaca aattttcggg ccattctgac agcctttagc cctgctcagg acatttgggg

    781 cacctctgct gccgcctatt ttgtgggcta tctgaagcca actaccttta tgctgaagta

    841 tgatgaaaat ggcacaatca cagatgctgt ggattgttct cagaatccac tggctgaact

    901 gaagtgctct gtgaagagct ttgagattga caagggaatc taccagacct ctaatttccg

    961 cgtggtgccc tctggagatg tggtgagatt ccctaatatt acaaacctgt gtccttttgg

    1021 agaagtgttt aatgctacta agttcccttc tgtgtatgcc tgggagagaa agaagatttc

    1081 taattgtgtg gctgattact ctgtgctgta caactccaca ttttttagca cctttaagtg

    1141 ctatggcgtg tctgccacta agctgaatga tctgtgcttc tccaatgtgt atgccgattc

    1201 ttttgtggtg aagggagatg atgtgagaca gatcgcccca ggacagactg gcgtgattgc

    1261 tgattacaat tataagctgc cagatgattt catgggctgt gtgctggctt ggaatactag

    1321 gaacattgat gctacttcca ctggcaatta taattacaag tatcggtatc tgagacatgg

    1381 caagctgagg ccctttgaga gagacatctc taacgtgcct ttcagccctg atggcaagcc

    1441 ttgcacccca cctgctctga attgttattg gccactgaat gattatggct tttacaccac

    1501 tactggcatt ggctaccagc cttacagagt ggtggtgctg tcttttgaac tgctgaatgc

    1561 ccctgccaca gtgtgtggac caaagctgtc cactgacctg attaagaacc agtgtgtgaa

    1621 ctttaacttt aatggactga ctggcactgg cgtgctgact ccttctagca agagatttca

    1681 gccatttcag cagtttggcc gggatgtgtc tgatttcact gattccgtgc gagatcctaa

    1741 gacatctgaa atcctggaca tttccccttg ctcttttggc ggcgtgagcg tgattacacc

    1801 tggaacaaat gcttcctctg aagtggctgt gctgtatcag gatgtgaact gcactgatgt

    1861 gtctacagcc atccatgccg atcagctgac accagcttgg cgcatctatt ctactggaaa

    1921 caatgtgttc cagactcagg ccggctgtct gatcggagct gagcatgtgg acacttctta

    1981 tgagtgcgac attcctattg gagctggcat ttgtgctagt taccatacag tgtctctgct

    2041 gcggagtact agccagaagt ctattgtggc ttatactatg tctctgggcg ctgatagttc

    2101 cattgcttac tctaataaca ccattgctat ccctactaac ttttccatta gcattactac

    2161 agaagtgatg cctgtgtcta tggctaagac ctccgtggat tgtaatatgt acatctgcgg

    2221 agattctacc gaatgtgcta atctgctgct gcagtatggc agcttttgca cacagctgaa

    2281 tcgggctctg tctggcattg ctgctgaaca ggatcgcaac acacgggaag tgttcgctca

    2341 agtgaagcag atgtataaga ccccaactct gaagtatttt ggcggcttta atttttccca

    2401 gatcctgcct gaccctctga agcccactaa gcggtctttt attgaggacc tgctgtttaa

    2461 caaagtgaca ctggctgatg ctggctttat gaagcagtat ggcgaatgcc tgggcgatat

    2521 taatgctaga gatctgattt gtgcccagaa gttcaatggc ctgacagtgc tgcctcctct

    2581 gctgactgat gatatgattg ctgcctacac tgctgctctg gtgtctggca ctgccactgc

    2641 tggatggaca tttggcgctg gcgctgctct gcagatccct tttgctatgc agatggccta

    2701 tcggttcaat ggcattggag tgacccagaa tgtgctgtat gagaaccaga agcagattgc

    2761 caaccagttt aacaaggcca ttagtcagat tcaggaatcc ctgacaacaa catccactgc

    2821 cctgggcaag ctgcaggacg tggtgaacca gaatgctcag gccctgaaca cactggtgaa

    2881 gcagctgagc agcaattttg gcgccatttc cagtgtgctg aatgatatcc tgtcccgact

    2941 ggataaagtg gaggccgaag tgcagattga caggctgatt acaggcagac tgcagagcct

    3001 gcagacctat gtgacacagc agctgatcag ggctgctgaa atcagggctt ctgccaatct

    3061 ggctgctact aagatgtctg agtgtgtgct gggacagtcc aagagagtgg acttttgtgg

    3121 aaagggctac cacctgatgt ccttcccaca ggctgcccct catggagtgg tgttcctgca

    3181 tgtgacctat gtgccatccc aggagaggaa cttcaccaca gccccagcca tttgtcatga

    3241 aggcaaggcc tacttccctc gggaaggcgt gttcgtgttt aatggcactt cttggtttat

    3301 tacacagcgg aacttcttta gcccacagat catcactaca gacaatacat ttgtgtccgg

    3361 aaattgtgat gtggtgattg gcatcattaa caacacagtg tatgatcctc tgcagcctga

    3421 gctggactcc ttcaaggaag agctggacaa gtacttcaag aatcatacat ccccagatgt

    3481 ggatctgggc gacatttccg gcattaacgc ttctgtggtg aacattcaga aggaaattga

    3541 ccgcctgaat gaagtggcta agaatctgaa tgaatccctg attgacctgc aggaactggg

    3601 caagtatgag cagtatatta agtggccttg gtatgtgtgg ctgggcttca ttgctggact

    3661 gattgccatc gtgatggtga caatcctgct gtgttgcatg acctcctgtt gcagttgcct

    3721 gaagggcgct tgctcttgtg gatcttgctg caagtttgat gaggatgact ctgagccagt

    3781 gctgaagggc gtgaagctgc attacacagg gcccggcggc gactacaagg acgatgacga

    3841 caagtgatag atcgatgcat ggatccgttt aaaccgagct ccagctttgt tccctta

    The spike protein of SARS-Corona Virus在SWISS-PROT蛋白质序列:

    The spike protein of SARS-Corona Virus在PDB蛋白质结构序列:

    (3)文献信息的查找与管理

    有效地使用NCBI PubMed提供的各种主要功能,查询并下载相关课题或研究方向的论文文摘与文献全文。

    查询Influenza A Viruses分子进化研究方向的文章。

    (3)NCBI数据库简介:

    Nucleotide  

    该数据库由国际核苷酸序列数据库成员 HYPERLINK "/view/1209454.htm"美国国立卫生研究院GenBank、日本DNA数据库(DDBJ)和 HYPERLINK "/view/3565.htm"英国Hinxton Hall的欧洲分子生物学实验室数据库(EMBL)三部分数据组成。这三个组织联合组成国际核苷酸序列数据库协作体,每天交换各自数据库中的新增序列记录实现数据共享。其中的序列数据也通过与 HYPERLINK "/view/923002.htm"基因组序列数据库(GSDB)合作获取;专利序列数据通过与美国专利与商标局、国际专利局合作获取。

    Genome

      即 HYPERLINK "/view/1011166.htm"基因组数据库,提供了多种基因组、完全染色体、Contiged序列图谱以及一体化基因物理图谱。

    Structure

      即结构数据库或称分子模型数据库(MMDB),包含来自X线晶体学和三维结构的实验数据。MMDB的数据从PDB(Protein Data Bank)获得。NCBI已经将结构数据交叉链接到书目信息、序列数据库和NCBI的Taxonomy中运用NCBI的3D结构浏览器和Cn3D,可以很容易地从Entrez获得分子的分子结构间相互作用的图像。

    Taxonomy

      即生物学门类数据库,可以按生物学门类进行检索或浏览其核苷酸序列、蛋白质序列、结构等。

    PopSet

      包含研究一个人群、一个种系发生或描述人群变化的一组组联合序列。PopSet既包含核酸序列数据又包含蛋白质序列数据。

    Entrez

    功能强大,在于它的大多数记录可相互链接,既可在同一数据库内链接,也可在数据库之间进行链接。当运用BLAST软件比较某氨基酸或DNA序列与库中其他氨基酸或DNA序列差异即进行相似性检索时,则会涉及到蛋白质库或核苷酸库的库内链接。库间链接发生在核苷酸数据库内的记录与PubMed库中已发表序列的引文间的链接,或蛋白质序列记录与核苷酸序列库中编码它的核苷酸序列间的链接。

    NCBI数据库检索

    NCBI数据库的检索方法很简单,在检索框中输入检索词,检索词间默认逻辑关系为AND,检索规则基本同PubMed。可以通过下拉菜单选择记录的显示格式,通常选择GenBank Report格式或FASTA Report格式。当选择GenBank Report格式后,屏幕显示较完整的基因记录,其内容包括:基因位点(Locus)、基因定义(Definition)、基因存取号(Accession)、 核酸编号(NID )、关键词(Keywords)、 来源(Source)、组织分类(Organism)、参考文献(Reference)、 著者(Author)、题目(Title)、期刊Journal)、Medline存取号(Medline)、序列特征(Features)、基因(Gene)、CDS(cDNA)、等位基因(Allele) 对等的肽(Mat-Peptide )、计算碱基数(Base Count)、原序列(Origin)。而FASTA Report格式仅包括检出序列的简要特征描述。

    OMIM

       HYPERLINK "/view/177172.htm"孟德尔遗传学(OMIM)数据库是人类基因和基因疾病的目录数据库。该数据库包括原文信息、图片和参考信息,同时还可以链接到Entrez系统MEDLINE数据库中相关文献和序列信息。主页如图3所示。

    BLAST相似性检索

      BLAST(Basic Local Alignment Search Tool)是用于序列相似性检索的一个重要数据库,是区分基因和基因特征的工具。该软件能在15秒内完成整个DNA数据库的序列检索。BLAST记录的相关度有明确的统计学解释,以便更容易地将相关记录与随机的数据库记录相区分。在NCBI主页的左工具条中,点击BLAST图标,即进入BLAST主页。

    BLAST 主页提供了几种BLAST检索软件。其中BLAST2.0是一种新的BLAST检索工具,它在原有基础上作了改进,运行速度更快,灵敏度更高,同时具有Gapped BLAST 和PSI-BLAST两种软件的新功能。Gapped BLAST 允许在对准的序列中引入空位(碱基缺失或插入),引入空位(Gaps)意味着在比较两个相关序列时不会出现中断(Break)现象。这些空位对准的记分系统更能反映相关序列的类似程度。PSI-BLAST的全称是Position-Specific Iterated BALST,即特殊位置重复BLAST,它提供了自动、易用的概貌(Profile)检索,是查找序列同源的有效工具。

    实验要求:

    (1)以其中的一个信息中心网站为例,列举其中的主要资源(数据库、网上分析、生物计算、数据下载等)。

    (2)能够解释给定序列或基因组数据的含义。

    (3)检索文献的技巧和效率。

    实验二 序列多重比对及进化分析

    实验目的:

    学习序列比对工具BLAST以及ClustalW等的使用,能够对序列数据进行初步的分析。

    掌握基于DNA序列和蛋白质序列构建系统进化树的常用方法和常用工具。

    实验内容:

    在GeneBank数据库中,检索10条轮状病毒(Homo sapiens, Rotavirus)VP7基因的DNA序列,并使用CLUSTALW软件对序列进行多重序列比对;

    检索结果详见电子稿附件:VP7.txt文件

    多重序列比对结果详见电子稿附件:VP7.aln文件

    在GeneBank数据库中检索10条SARS病毒Spike蛋白的氨基酸序列,使用CLUSTALX软件对这十条序列进行多重序列比对;

    检索结果详见电子稿附件:Spike SARS.txt文件

    多重序列比对结果详见电子稿附件:Spike SARS.aln文件

    使用ClustalW软件或其他软件包构建上述DNA分子系统发生树。

    实验要求:

    提交使用CLUSTALX及PHYLIP软件进行多重序列比对及构建系统发生树的结果;

    VP7 outtree:

    Spike of SARS outtree:

    总结多重序列比对及构建系统发生树的关键事项。

    选择合适的比对算法,构建系统发生树时适当选择独立关系的分支序列。

    实验三 蛋白质结构分析及结构预测

    实验目的:

    1、掌握蛋白质序列检索的操作方法;

    2、熟悉蛋白质基本性质分析;

    3、了解蛋白质二级结构预测。

    5. 学会运用结构浏览软件对生物大分子的结构进行观察。

    实验内容:

    使用Entrez或SRS信息查询系统检索水通道(Aquaporin-1, AQP1)蛋白质序列。

    >giref|NP_001009194.1| aquaporin-1 [Ovis aries]

    MASEFKKKLFWRAVVAEFLAMILFIFISIGSALGFHYPIKSNQTTGAVQDNVKVSLAFGLSIATLAQSVGHISGAHLNPAVTLGLLLSCQISILRAIMYIIAQCVGAIVATVILSGITSSLPDNSLGLNALAPGVNSGQGLGIEIIGTLQLVLCVLATTDRRRRRDLGDSGPLAIGFSVALGHLLAIDYTGCGINPARSFGSSVITHNFQDHWIFWVGPFIGAALAVLIYDFILAPRSSDLTDRVKVWTSGQVEEYDLDADDINSRVEMKPK

    给出实例了解生物大分子结构数据库PDB中的记录方式,看懂记录中的内容并会运用Rasmol软件观察蛋白质的三维结构。

    PDB文件1IH5.pdb的记录方式分析见附录。下图为在Rasmal软件中观察的结果:

    球棒模型

    三维图

    含标注的分组丝带模型

    使用BioEdit软件对上述蛋白质序列进行分子质量、氨基酸组成、和疏水性等基本性质分析。

    分子质量与氨基酸组成:

    疏水性分析:

    使用PSIPRED web server( HYPERLINK "http://bioinf.cs.ucl.ac.uk/psipred/"http://bioinf.cs.ucl.ac.uk/psipred/)对水通道蛋白质序列进行二级结构预测。同时上uniprot数据库查看水通道蛋白质二级结构,并做对比。

    在线分析:

    Uniprot与PDB数据库:

    预测结果与数据库结果基本一致。

    实验要求:

    提交使用上述软件对人水通道蛋白质序列进行基本性质分析、结构分析以及二级结构和三维结构的分析结果;

    见上图。

    实验四 核酸序列分析

    一.实验目的

    掌握已知或未知序列接受号的核酸序列检索的基本步骤;

    掌握使用BioEdit软件进行核酸序列的基本分析;

    熟悉共有序列logo图的使用;

    熟悉RNAfold软件的使用;

    三.实验内容

    1、使用Entrez或SRS信息查询系统检索人瘦素 (leptin) 的mRNA、基因组DNA、外显子等核酸序列,连接提取该序列内容,阅读序列格式的解释,理解其含义;

    2、使用BioEdit软件对上述核酸序列进行分子质量、碱基组成、碱基分布、序列变换等基本分析,并从BioEdit软件的“help”栏了解该软件的其它功能;

    3.使用weblogo方法( HYPERLINK "/"/ )对多序列比对结果构建共有序列进行可视化表示。

    4.使用RNAfold ( HYPERLINK "http://rna.tbi.univie.ac.at/cgi-bin/RNAfold.cgi"http://rna.tbi.univie.ac.at/cgi-bin/RNAfold.cgi ),对microRNA前体的二级结构进行预测。

    四.实验方法

    1、调用Internet浏览器,并在其地址栏输入Entrez网址: HYPERLINK "/Entrez"/gquery/gquery.fcgi;

    2、在输入栏输入homo sapiens leptin;将检索的核酸序列输入BioEdit软件进行序列基本分析;

    3、对如下的多序列进行共有序列的分析:

    > 19082_AF115399

    ttctctgaaatatgaatttagACTGGTACTTATCATGGAG

    > 45328_AB000381

    gcctgctttctcccctctcagGGACTTACAGTTTGAGATG

    > 45328_AB000381

    cattgctgcttctttttttagGCATAAATTCTCGTGAACT

    > 45330_AB001517

    aacttcctgtgtgttttgcagACAGCTGGATAGAAAACGA

    > 45331_AB001517

    acaattttgttttcttcacagTTTTCAAATTTGCTGGGTA

    > 45331_AB001517

    tgtggtttttgtctttatcagCAACAAATCTGACACGCTG

    > 45331_AB001517

    gtgacctctggcgtcctgcagGGGGCGATGCGCTGCTGGT

    > 45331_AB001517

    atgtccgcgttccttccatagGAAGTTTGTTGTCACAAAG

    > 45331_AB001517

    tgccatctccctcttttccagGTGCTTTGTGGTTGGGAGC

    > 45331_AB001517

    accctgtgcttccccttgcagCTGTACTCACTCAGCCAGG

    > 45331_AB001517

    tcttctctctcgtcaattcagGTACTTCTTCAATAAAGAA

    > 45331_AB001517

    ttacaggcccgttctctgcagCATTTCAGATCAGAGCATC

    > 45331_AB001517

    cagcttcccccgtgtgcacagGCCTGGGCCAGCTGCTGGT

    > 45331_AB001517

    gcccctcctgtcctgcctcagGTCAAGGTGTGGAACACCC

    > 45331_AB001517

    gaccttgcctcttctctgcagGTACCGAAACTTCCGCACC

    > 45331_AB001517

    cgcctccttgctctacggtagGTTTTGTCTGGACACGAAG

    > 45331_AB001517

    ttactttgcatctctgtttagCTCTGGCTGTGACTTTTCG

    > 45331_AB001517

    ccatgtctcctctccacccagGGCCTTCACCGCCCTGTGC

    4.对如下microRNA前体序列进行二级结构预测:

    >hsa-mir-1-2

    ACCUACUCAGAGUACAUACUUCUUUAUGUACCCAUAUGAACAUACAAUGCUAUGGAAUGUAAAGAAGUAUGUAUUUUUGGUAGGC

    >hsa-mir-133b

    CCUCAGAAGAAAGAUGCCCCCUGCUCUGGCUGGUCAAACGGAACCAAGUCCGUCUUCCUGAGAGGUUUGGUCCCCUUCAACCAGCUACAGCAGGGCUGGCAAUGCCCAGUCCUUGGAGA

    >hsa-mir-221

    UGAACAUCCAGGUCUGGGGCAUGAACCUGGCAUACAAUGUAGAUUUCUGUGUUCGUUAGGCAACAGCUACAUUGUCUGCUGGGUUUCAGGCUACCUGGAAACAUGUUCUC

    五.实验要求

    1.归纳对人瘦素 (leptin) 的核酸序列分析的结果,列出主要的分析结果;

    见上图。

    2.总结共有序列可视化分析的基本步骤和特点。

    3. 总结RNAfold软件的基本步骤和特点。

    ①不能够双击应用程序,若双击RNAfold.exe应用,只能手动输入序列,而且只能一条一条输入,极其麻烦

    ②应该在Dos环境下,到达应用程序的当前目录。然后输入命令:

    RNAfold.exe <seq.fasta >result.txt其中“<”代表序列以文件形式作为输入,这就允许输入多个序列进行结构预测,而不单单是一个。若没有这个"<", 则无结果。

    “>”代表结果以文件形式输出,最终的预测的结构在result.txt文件中。若没有这个符号,则会输出在dos环境下。

    说明:本实验采用在线版可视化界面。

    知识改变命运

    • 下载文档
    • 收藏
    • 0

    有关的专题