最小生成树心得体会

时间：2014-05-23 10:05

任何一个无向连通图的最小生成树为什么有一棵或多棵呢

1.可以有多棵最小生成树例如图(i-j k :点i到j间有边且权为k)1-2 12-3 11-3 1选边1-2，2-3是边权和为2的最小生成树选边1-3，2-3也是边权和为2的最小生成树2.树是E=V-1边数最少的无向连通图，故必有树

加权的无向连通图的最小生成树有几棵

STP生成树的工作原理一、STP生成树的工作原理STP的基本原理可以归纳为三步，选择根网桥RB、选择根端口RP、选择指定端口DP。

然后把根端口、指定端口设为转发状态，其它接口设为阻塞状态，这样一个逻辑上无环路的网络拓扑就形成了。

1.选择根网桥选择根网桥的依据是网桥ID,由优先级和MAC地址组成，先看优先级，优先级相同时再看MAC地址，值越小越优先选择。

根网桥的选择过程与政治选举类似。

2.选择根端口每一个非根网桥将从其接口选出一个到根网桥管理成本（administrativecost）最低的接口作为根端口，选择的依据是(1)自身到达根网桥的根路径成本最低的接口。

根路径成本的计算是，接口收到BPDU中所包含的成本与接口的成本的累加。

(2)直连网桥ID最小(3)端口ID最小3.选择指定端口当一个网段中有多个网桥时，这些网桥会将他们到根网桥的管理成本都通告出去，其中具有最低管理成本的网桥将作为指定（designated）网桥。

指定网桥中发送最低管理成本的BPDU的接口是该网段中的指定端口。

在每段链路上，选择一个指定端口，选择的依据是：(1)发送最低根路径成本的BPDU的接口(2)所在网桥ID最小(3)端口ID最小总结：选举根端口，比较接收的BPDU选举指定端口，比较发送的BPDU二、STP拓扑稳定后，所以工作中的交换机接口都将处于转发或阻塞状态，生成树的工作过程如下：(1)根交换机创建成本为0的HelloBPDU，并向其所有接口转发出去(2)邻接的非根网桥将接收的hello数据包中的成本加上接收端口的成本后，

《最小生成树问题》概要设计包括选择什么数据结构

本文是在概要设计实践和学习中的一些心得与学习笔记，希望与大家分享，如有不妥之处欢迎指正。

关键字：概要设计，结构化，OOD 正文：在需求明确、准备开始编码之前，要做概要设计，而详细设计可能大部分公司没有做，有做的也大部分是和编码同步进行，或者在编码之后。

因此，对大部分的公司来说，概要设计文档是唯一的设计文档，对后面的开发、测试、实施、维护工作起到关键性的影响。

一、问题的提出概要设计写什么

概要设计怎么做

如何判断设计的模块是完整的

为什么说设计阶段过于重视业务流程是个误区

以需求分析文档还是以概要设计文档来评估开发工作量、指导开发计划准确

结构化好还是面向对象好

以上问题的答案请在文章中找。

二、概要设计的目的将软件系统需求转换为未来系统的设计；逐步开发强壮的系统构架；使设计适合于实施环境，为提高性能而进行设计；结构应该被分解为模块和库。

如何生成决策树
救急

决策树是对分类问题进行深入分析的一种方法，在实际问题中，按算法生成的决策树往往复杂而庞大，令用户难以理解。

这就告诉我们在重分类精确性的同时，也要加强对树修剪的研究。

本文以一个决策树算法的程序实现为例，进一步讨论了对树进行修剪优化时可能涉及的问题，目的在于给决策树研究人员提供一个深入和清晰的简化技术视图。

引言机器学习领域研究对数据的归纳分类，主要集中在预测精确度方面。

然而，在许多实际业务中，只有数据的预测结构更易于理解的分类规则才易让人接受，就象这个分类规则所解决的决策问题一样让人清楚明白。

在机器学习和统计领域，决策树归纳作为一种分类问题的解决方法正在被广泛的研究。

由于许多树简化规则正在生成越来越简单和越来越小的决策树，树简化规则已经成为继预测精度之后的第二个研究焦点。

总结树简化技术的关键问题在于解决方法的多样性。

要驾御这种多样性，可以将这些方法分为五类。

类的建立是将树归纳看作是对预想树空间的即席状态搜索。

一、决策树算法的程序实现决策树归纳算法在机器学习、统计和其它解决分类问题的领域有着广泛的应用。

决策树可以按如下方式分类一个查询事例，给定要分类的查询Q，树将沿一条路径从根遍历到叶节点，直到将类标签分配给Q。

测试通常能够评价描述事例的特征或（如布尔或线形）组合特征集。

笔者开发的决策树算法包括四个输入：1. C--培训事例集，由特征集和一个类标签定义2. R--测试集，用于将培训事例集分成若干子集3. E（）--评价函数，用于评价分类结果的质量4. Stop（）--暂停函数，用于确定何时结束决策树算法输出的决策树T的每一叶代表一个类，通常有唯一的类标签。

决策树由根部向下运用递归分割算法。

Make-T函数生成决策树，并完成后期修剪工作，这可能有三种结果：维持原状、修剪或转换成另一种数据结构。

Induce-T函数输出树T，它输入C中的子集C'、测试集R、评价函数E（），以及暂停函数Stop（）。

Induce-T实施登山式搜索，即只前进不后退，至于达到什么状态由Stop（）决定。

初始树包括一个节点、根和所有的事例C，状态随树的扩展而变化，表现为树的递归请求。

每一个对Induce-T的请求创建一个包含输入子集C'的节点，划分事例 C'的最好的测试集由Best（）函数决定，它借助于E（）评价给定测试集和分类结果的质量，并返回最好测试集Best（）。

再将Best（）分类方法P应用于事例子集C'，并返回Best（）的值V，返回若不能满足Stop（），则树继续扩展。

目标状态集由Stop（）决定，当返回为真时结束树的扩展。

例如，当选定同质规则时，如果所有事例C'有相同的类标签标签，则函数Stop（）返回真。

同质规则可以被作为缺省的暂停规则，因为它暗含在所有的暂停规则之中。

Stop（）函数决定将N定义为叶节点还是内部节点。

如果是后者，树将继续扩展：节点N被设置为内部节点，子树被标记为V中的测试输出值 V'；如果是前者，节点N被设置为叶节点，叶节点的类标记由其所包含的事例C'决定，通常选择的类标签是事例C'中大多数事例所共有的。

树归纳算法，如这里提及的生成算法，必须是计算高效的，因为建立决策树是一项复杂的任务，搜索的复杂性会随树的深度（即树根到最低的树叶的距离）呈指数增长。

因此，修剪算法应建立于寻找使评价函数E（）最大的测试集。

如何设计和优化评价函数E（）自然成为了系统开发人员关注的问题。

二、对树进行修剪优化时应考虑的问题1、决策树的大小决策树变的异常庞大有多种原因。

其中之一是特征描述不当，有些树特征描述方式不能精确的建立目标概念模型，当用这种描述方式时，目标模型非常复杂。

相反，运用的当的描述将大大降低模型的复杂程度。

因此，这个问题很好地提醒我们，树修剪过程中要考虑相应的描述；另一个导致树庞大的原因是噪声。

当事例包含大量的特征噪声（即错误标签的特征值）或类噪声（即错误标签的类值）时，归纳运算会因为不相关的事例特征而将树扩展的漫无边际。

噪声导致无关的事例掺杂在选定的测试集中，这将引起无谓建模的现象，即树将目标概念和内部噪声都作为建模的对象。

这是个普遍的问题，因为给定事例中都不同程度地包含噪声。

虽然有多种降低噪声的剪树方法，但记住没有一个剪树方法对任何噪声都有效。

超大的树通常是破碎的--过多的叶，且每叶仅有少数的事例。

这样的叶比拥有许多事例的叶更易出现分类错误，更易受噪声影响。

这些叶节点（或更准确地说，其相应的树路径）是分散的，发生的可能性都很低。

因而，另一种树简化方法是通过剪掉只有少数事例的叶子来消除这种分散性。

不管什么原因，复杂树不仅难以理解，而且分类模糊，因为小散点比大散点更易出错。

然而，毕竟在培训集中辨别特征的真伪决非易事，在不考虑对树在未知测试事例中运行性能的影响下，修剪树往往会降低对培训集分类的精确度。

2、权衡精确度与简易性修剪方法在于确保精确程度的同时，提高可理解性。

这两个目标不一定是矛盾的，可能有种方法能同时提高精确度和可理解性。

实际上，最初引入树简化方法的目的是控制培训集中的噪声，而后发现它可以提高许多含噪声的数据集的精确度。

对简化（或修剪）程度的控制一直是人们争论不朽的问题。

通过牺牲精确度修剪的决策树常常灵巧的出奇，然而，保守一点的修剪可能带来精确度的大大提高，这在实际应用中至关重要。

故此，许多学者在研究决策树的精确度与简易性的最佳比例，但在随机选择的培训集中很难作做到这一点，因为单凭培训集中的事例，难以区分树的哪部分复杂是由噪声引起的和哪部分是由树本身属性引起的。

而且，专门领域的知识不属于培训集之内，就需要在培训集中评价专门领域知识的噪声级别、自身属性的复杂度、以及选择需要简化的程度。

对知识稀疏的归纳算法不会涉及这些，因而每个树就假定了模型的复杂程度和培训噪声的级别，这将影响树简化的整个过程。

这些算法与描述偏差还有所不同。

例如，许多算法假定模型是正规分散的形式，测试对事例特征是单变量的函数，而其它算法假定特征值可以进行线形组合。

自然，针对特定的任务，会有一些算法比另一些算法要好。

如果无法决断哪个算法对给定的数据库最好，就它们放在一起运行，然后比较结果。

三、决策树的修剪算法修剪树有多种算法，一般人们将其分为五大类方法。

最常用的是直接控制树大小的一类方法，通过前期修剪（即在树扩展过程中强行增加一个停止规则），或后期修剪（在树生成后剪掉子树）完成，或逐渐调整树的大小。

再一类方法主要是扩展测试集，首先按特征构成是数据驱动还是假设驱动（即借助于以前建立的树预测构件特征）的差别，将建立的特征组合或分割，然后在此基础上引进多变量测试集。

这些方法在调整树表达时有效地扩展了树集。

第三类，包括选择不同的测试集评价函数，通过改善连续特征的描述，或修改搜索算法本身实现。

第四类，数据库约束，即通过削减数据库或事例描述特征集来简化树。

第五类，将树转换成另一种数据结构（如决策表或决策图）。

这些方法通常可以在同一种算法中相互结合，进而增强各自的功能。

例如，经常在搜索测试或搜索空间测试中引入控制树大小的方法。

简化决策树的最常用方法是在树建立过程中控制其大小，包括前期修建和后期修剪。

前期修剪阻止决策树按默认的同质暂停规则生成一个完全的树，要作到着一点，需在树生成进程中加入另一个暂停规则。

自由限制树的简易修剪形式非常适用，然而，通常暂停规则将评价树继续扩展的效应，如果效用为零（或很小），则停止扩展。

或者说此后的处理对树的输出形态影响不大。

前期修剪较后期修剪有效，因为它尽可能早的结束了树的生成阶段。

约束暂停规则往往同时过滤掉相关和无关测试集，而且，当选择测试集和修剪时使用对某个节点是局部的同一个测试约束时会出现问题，因为约束的绝对值往往因样本的大小不同而变化。

前期修剪会引起树在不完全成熟之前停止，即树可能在不应停止的时候而停止扩展，，或称之为 horizon效应。

即使这样，前期修剪对大规模的实际应用还是值得研究的，因为它相当高效。

人们有望在未来的算法中解决horizon效应。

后期修剪是人们普遍关注的树简化方法，后期修剪算法输入一个未修剪的树T，输出修剪了T中一个或多个子树后获得的树T'。

算法并非搜索每个可能的 T'，而是借助于启发式搜索。

修剪将子树转化为叶，进而用叶节点替代内部节点。

与前期修剪不同的是，后期修剪没有使用一个消除细节的函数，而是直接采用默认的同质暂停规则。

当树相对训练集冗余时（即噪声参与了建模），修剪将非常有效地提高精确度。

例如，给定培训集m，假设包含培训集n的叶节点类标签为多数满足n'〈= n，则替代错误率为（n-n'）\\\/ m，低层叶节点对替代精确度的影响最小，因而被最先修剪。

后期修剪方法借助于多种评价函数，用以确定修剪一个节点是削弱还是增强了事例集的精确度。

恰当的修剪可以提高分类的精确度。

尤其是当训练集噪声级别比较高时，修剪相当有效。

有些后期修剪方法将培训集分为两个子集。

一个用于生成树，另一个用于后期修剪。

不妨成之为生成集和修剪集。

生成集常用于生成一个树，然后，按修剪变量生成树集S，修剪集将从S中选择一个最佳的树。

例外情况是除错修剪（REP），即修剪集对树进行修剪，而不单单是选择。

修剪集方法的优势在于生成树集，而非一个树。

尤其是当领域专家算法对选择的树不满意时，可以从树集中进行人为挑选，树集归纳可以提高预测的精确度；将培训集分为两个子集的不足之处在于，设计决策受人为影响，小的培训集可能产生一个很小的树，因为低层部分被剪掉，但这恰恰是应该选择一个尽可能大的培训集的很好的理由，减小培训集的大小相当于增加了修剪预测精确度的不确定性。

后期修剪多种算法，如MCCP、 REP、MEP、CVP、PEP、EBP等，它们的精确度和简化程度各不相同，感兴趣的读者可以查阅相关资料，在此不予以详述。

结束语在精确度与简易性之间选择权衡值可能是决策树永远逃避不了的主题，但不管怎样，记住这一点是重要的，即即使我们专注的问题是修剪树，但决不能将精确度置之不理。

修剪树如果导致精确度的大大降低，那修剪将是毫无意义的。

谈谈如何学习离散数学

NOIP级别中，普及组和提高组的要求不同。

但是这几类动规的题目掌握了，基本也就可以了：1、背包问题：01背包、完全背包、需要构造的多维01背包详见背包九讲2、最大降序：例如打导弹3、矩阵相乘：例如能量珠子4、买股票5、方格取数：单向的、双向的6、三角取数这些都是简单的动规的应用，必须掌握，背也要背出来，还要会套用。

至于排序，本人认为基本的选择排序大家都会，快速排序是一定要会的，当数据规模<500时用选择排序，当数据规模在500和100000之间是用快速排序，但是NOIP中经常考到基数排序，例如划分数线等，数据规模会达到1000000，用其他的排序法可能会超时一两个测试点。

至于搜索，那是必须掌握的深搜、广搜都要会，主要是深搜，当提高组碰到一下子想不出动规的状态转移方程式，深搜穷举也是可行的，一般都能拿到不少的分数。

个人之间广搜的用处不大，程序复杂而且爆机率很高。

当然n个for的穷举法在不得已的时候也能得不少分，只要if剪枝的好，对付八后问题等问题时，时间效率比很高。

另外就是图的遍历，有关图的最小生成树、图的单源最短路径，也是需要很好地掌握，一直会考。

当然，深搜的本事高的人可以用深搜搞定。

总结如下：要得一等，必须对模拟法和穷举法有深刻的体会，并知道很多变通的手段；对快排要背的滚瓜烂熟；对深搜要做到不管是贪心还是动规的题，都能用深搜实现，只不过少量点超时而已；动规要记住六大模型，然后背包要理解透彻；数学很重要，数学分析的题要做对，例如排组合、凸包、计算几何近几年常考。

有了这些，一等可以稳拿。

如何完全图生成最小二叉树

题目表述不明啊...........应该是这样吧最小生成树 1、最小生成树对于连通的带权图(连通网)G，其生成树也是带权的。

生成树T各边的权值总和称为该树的权，记作：这里: TE表示T的边集 w(u，v)表示边(u，v)的权。

权最小的生成树称为G的最小生成树(Minimum Spanning Tree)。

最小生成树可简记为MST。

2、生成树和最小生成树的应用生成树和最小生成树有许多重要的应用。

【例】网络G表示n各城市之间的网线路（其中顶点表示城市，边表示两个城市之间的，边上的权值表示线路的长度或造价。

可通过求该网络的最小生成树达到求解或总代价最小的最佳方案。

3、最小生成树性质（MST性质）（1）MST性质最小生成树性质：设G=(V，E)是一个连通网络，U是顶点集V的一个真子集。

若(u，v)是G中一条“一个端点在U中(例如：u∈U)，另一个端点不在U中的边(例如：v∈V-U)，且(u，v)具有最小权值，则一定存在G的一棵最小生成树包括此边(u，v)。

（2）MST性质的证明为方便说明，先作以下约定： ①将集合U中的顶点看作是红色顶点，②而V-U中的顶点看作是蓝色顶点，③连接红点和蓝点的边看作是紫色边，④权最小的紫边称为轻边(即权重最轻的边)。

于是，MST性质中所述的边(u，v)就可简称为轻边。

用反证法证明MST性质：假设G中任何一棵MST都不含轻边(u，v)。

则若T是G的一棵MST，则它不含此轻边。

由于T是包含了G中所有顶点的连通图，所以T中必有一条从红点u到蓝点v的路径P，且P上必有一条紫边(u'，v')连接红点集和蓝点集，否则u和v不连通。

当把轻边(u，v)加入树T时，该轻边和P必构成了一个回路。

删去紫边(u'，v')后回路亦消除，由此可得另一生成树T'。

T'和T的差别仅在于T'用轻边(u，v)取代了T中权重可能更大的紫边(u'，v')。

因为w(u，v)≤w(u'，v')，所以 w(T')=w(T)+w(u，v)-w(u'，v')≤w(T) 故T'亦是G的MST，它包含边(u，v)，这与假设矛盾。

所以，MST性质成立。

4、求MST的一般算法描述求MST的一般算法可描述为：针对图G，从空树T开始，往集合T中逐条选择并加入n-1条安全边(u，v)，最终生成一棵含n-1条边的MST。

当一条边(u，v)加入T时，必须保证T∪{(u，v)}仍是MST的子集，我们将这样的边称为T的安全边。

用伪代码可将算法描述为： GenerieMST(G){\\\/\\\/求G的某棵MST T〈-￠； \\\/\\\/T初始为空，是指顶点集和边集均空 while T未形成G的生成树 do{ 找出T的一条安全边(u，v)；\\\/\\\/即T∪{(u，v)}仍为MST的子集 T=T∪{(u，v)}； \\\/\\\/加入安全边，扩充T } return T； \\\/\\\/T为生成树且是G的一棵MST } 注意：下面给出的两种求MST的算法均是对上述的一般算法的求精，两算法的区别仅在于求安全边的方法不同。

为简单起见，下面用序号0，1，…，n-1来表示顶点集，即： V(G)={0，1，…，n-1}， G中边上的权解释为长度，并设T=(U，TE)。

求最小生成树的具体算法(pascal): A.Prim算法： procedure prim(v0:integer); var lowcost,closest:array[1..maxn] of integer; i,j,k,min:integer; begin for i:=1 to n do begin lowcost[i]:=cost[v0,i]; closest[i]:=v0; end; for i:=1 to n-1 do begin {寻找离生成树最近的未加入顶点 k} min:=maxlongint; for j:=1 to n do if (lowcost[j]0) then begin min:=lowcost[j]; k:=j; end; lowcost[k]:=0; {将顶点k 加入生成树} {生成树中增加一条新的边 k 到 closest[k]} {修正各点的 lowcost 和 closest 值} for j:=1 to n do if cost[k,j]