题目 序列摘要本文主要研究序列的结构问题通过建立相应的数学模型对序列中所隐藏的规律进行研究和分析给出了解决问题的最优方案并且对模型进行了评价和推广对于问题一为了挖掘序列的特征将其分为类和类以20种基本氨基酸为目标利用软件编程得出每一行每一种氨基酸出现的概率再运用主成分分析法进行降维利用软件进行数据处理得到矩阵然后再将模糊聚类问题转化为如下优化问题: 用模糊聚类分析方
单击此处编辑母版标题样式单击此处编辑母版文本样式第二级第三级第四级第五级DNA序列分类模型研究 2000年6月人类基因组计划中DNA全序列草图完成 2004年10月绘制了精确的全序列图标志着生命科学登月计划又向前迈出一步从此人类拥有了一部记录着自身生老病死及遗传进化全部信息的天书 DNA作为一种遗传物质早已在50多年前就被发现它是由4种碱基:腺嘌呤(A) 胞嘧呤C)
#
DNA序列分类 摘要 本问题是一个有人管理分类问题 首先分别列举出20个学习样本序列中1字符串2字符串3字符串出现的频率构成含41个变量的基本特征集接着用主成分分析法从中提取出4个特征然后用Fisher线性判别法进行分类得出了所求20个人工制造序列及182个自然序列的分类结果如下:20个人工序列:22 2325272934353637为A类其余为B类182个自然序列:1481027293
第31 卷第1 期
2015年深圳杯数学建模夏令营B题:DNA序列的k-mer index 问题这个问题来自 DNA序列的k-mer index问题给定一个DNA序列这个系列只含有4个字母ATCG如 S =CTGTACTGTAT给定一个整数值k从S的第一个位置开始取一连续k个字母的短串称之为k-mer(如k= 5则此短串为CTGTA) 然后从S的第二个位置 取另一k-mer(如k= 5则此短串为TGTAC)这样
#
#
#
DNA序列分类 摘要 本问题是一个有人管理分类问题. 首先分别列举出20个学习样本序列中1字符串2字符串3字符串出现的频率构成含41个变量的基本特征集接着用主成分分析法从中提取出4个特征.然后用Fisher线性判别法进行分类得出了所求20个人工制造序列及182个自然序列的分类结果如下:20个人工序列:22 2325272934353637为A类其余为B类.182个自然序列:14810272
违法有害信息,请在下方选择原因提交举报