
数据库到底是做什么的,和应用程序是什么关系
可以存储很大资源,查询方便,统计方便,汇总也很方便,总之想要看到什么结果,都可以清晰的看到。
嵌入式技术与应用
嵌技术应用 主要就业方向和前景: 式技术及应用是计算机应术发展,具有广泛的应用领域和发展前景,就业形势看好。
该专业毕业生适于IT行业、信息家电和机电类产品中的计算机应用设计开发岗位就业,担任嵌入式产品及应用系统的设计与开发工程师,从事嵌入式技术的应用项目设计开发、产品维护与技术服务等工作。
主干课程及实践环节:计算机系统组成、计算机接口技术、单片机及应用、数据库应用、计算机网络及应用、IT电子产品设计与仿真(EDA)、C\\\/C++\\\/JAVA程序设计、驱动程序设计、嵌入式操作系统、嵌入式系统设计、机器人及智能电子产品的软件开发、国家(或行业)专业技术资格认证课程,IT电子产品设计与仿真、驱动程序设计、计算机接口技术、嵌入式系统设计智能机器人软件开发等实训。
软件天才与技术民工--薛涌《天才是训练出来的》读后感金旭亮
[软件天才与技术民工--薛涌《天才是训练出来的》读后感金旭亮]软件天才与技术民工--薛涌《天才是训练出来的》读后感金旭亮长期以来,软件业一直被视为智力密集型的朝阳产业,大多数从业者都受过高等教育,其平均素质居于社会各行业的前列,这个产业的顶尖人物被公众视为知识英雄,比如微软公司的创始人比尔盖茨雄据世界首富之位多年,更是为人津津乐道,软件天才与技术民工--薛涌《天才是训练出来的》读后感金旭亮。
16年前我下决心开始学习计算机技术的时候,对这个行业也充满了自豪感。
然而世事难料,在2009年高考刚刚结束之际,中国权威出版机构社会科学文献出版社于2009年6月10日发布首部《中国大学毕业生就业报告(2009)》,其中计算机专业荣登就业最困难的十大专业光荣榜。
大约从2003年开始,我在北京理工大学这所211、985重点大学开设.NET课程,这件事后来给某些人炮轰--说我要将重点大学学生培养成IT民工,也曾有技术牛人谆谆教诲年青学生--想学软件,离金某人远些…程序员何时变成了IT民工?仅仅十多年,程序员就从精英沦落为民工,这也未免太戏剧性了吧
程序员真的是IT民工?在中国,不少程序员都是CRUD程序员,这不能怪他们,因为中国多数项目都是CRUD的。
所以,CRUD似乎成为了IT民工身上的标签,问题是CRUD这活真的象在建筑工地上倒水泥一样,不需要太高的智商和较多的训练?下面分析一下需要从事这个CRUD的工作的程序员,到底需要哪些知识和技能。
我大致地思索了一下,画了以下这个图,展示出一名.NET程序员民工要顺利参与一个CRUD的数据库应用项目开发所大致需要掌握的知识与技能:图1说句实话,这个图虽然挂一漏万,但列出来的知识点与需要掌握的技能之多已经很恐怖了,对于一个需要掌握这么多知识与技术才能胜任与干好的工作,非要认为它是一个低级的民工就可以干的活,想必持这种观点的人一定知识丰富如汪洋大海,属白骨精(白领-骨干-精英)一族。
需要掌握这么多的知识,才有资格当一名合格的CRUD程序员,IT民工的门槛其实挺高的,不是吗?事实也如此,软件开发行业从业人员的平均学历我估计至少是大专,很可能是本科,其中固然有一些只有高中甚至更低学历的奇才,但这仅是少数,而且这些人,虽然学历低,但绝不会是一个低智商的人。
这说明软件开发行业从业者的平均智商应该是挺高的。
我在旅美学者薛涌写的《天才是训练出来的》一书中找到了美国的一些统计数据:美国大学本科生的中等智商为118,学士学位获得者的中等智商为123,优秀毕业生的中等智商为133,物理学博士的平均智商为140。
而在一般的人口中,中等智商为100。
也就是说,你的智商如低于100分,你就属于偏笨的人,高于此线,就属于偏聪明的了。
老外依据数据得出结论:要把书读懂读好,智商还真的得达到一定的水准。
所以,能上大学并且顺利拿到学位的人,基本上是属于比较聪明的那一批人。
我们中国也有类似的观点,比如经常可以听到某家长叹息其小孩子成绩不好:我家的那个小祖宗,看来根本就不是读书的那块料
套用老外的观点,就是说这个小孩可能智商达不到上大学的基本要求。
老外什么都喜欢数字化,所以动不动就来个什么智商测试,而中国虽然不讲智商这一套,但其实高考就可以看成是一次智商测试。
在80、90年代,那时的大学生,经常都是百里挑一、几十里挑一,记得89年我参加高考,那年我们省的录取率还是十几取一。
所以那个时代的大学生被称为天之娇子,并非空穴来风。
重大的变化发生于1999年,从这一年开始中国大学开始扩招,尤其是计算机专业,更是扩招的重点,其规模迅速膨胀,录取率大大地提高,其结果是,用一句打趣的话说,阿猫阿狗都去读大学了,中国大学没有做智商测试的制度,不然,我想应该会看到21世纪在校大学生的平均智商比上世纪80、90年代的在校大学生的平均智商要低。
但扩招对一些历史悠久声誉良好的重点大学的影响就没那么大,因为不管你怎么扩招,能进名校(比如北大清华)的学生,智商是不会低的,因为其入学竞争仍然十分激烈,各方面差一点的根本就没这个机会。
老外还给出了一些著名科学家的智商:牛顿190,伽利略195,开普勒175,达尔文165,哥白尼160。
我对这些数据抱有怀疑:牛顿和伽利略等的那个时代有智商测试吗?这些数据是从哪计算出来的?但这些著名科学的智商高于普通人,我想不会有人怀疑。
现在回到软件开发这个行业,其从业者平均学历为大专以上,应该说明这个行业需要的是整个人群中比较聪明的那一批。
这个观点与我的实际感受是一致的。
我在IT业混了十多年,深感这个行业牛人辈出,别说这个行业的顶尖级别人物,就是在许多普通的IT企业、科研院所中,也有不少的让人佩服的牛人。
我在北理工教了8年书,笨的学生实在没见着,而不少学生的聪明程度和学习能力等,都比我在他们这个年纪时要强得多,还有一些学生,真的很聪明,悟性好,能举一反三,在技术上没多久就可以跑到我前面去了。
所以,软件开发应该是一个需要有较高智商的行业,我觉得不会有太大疑义。
为什么智商重要?我在薛涌写的《天才是训练出来的》找到了以下描述:在美国的白人中,生于占人口5%的最低层的穷孩子,日后生活在贫困线以下的可能比那些生于占人口5%的最富裕阶层的孩子要高8倍。
但是,那些智商属于最低的5%的孩子,则比那些智商属于最高的5%的孩子日后生活于贫困线以下的可能性高15倍。
也就是说,你的脑子是否好使,比你的家庭是否富裕对你的未来重要得多。
中国人有句俗话:三百六十行,行行出状元。
这些状元的出身并不重要,但他们应该接近100%的都有高的智商。
智商这个东西非常奇特,老外研究了这么多年,也没研究明白很多关键问题,比如智商是不是纯天生的?后天不能提高?如果能,那能提高多少?如何解释一些高智商的人一辈子成就平平?如何解释某些天才在某个领域内出类拔萃,在其他领域却连普通人都比不上?还有,更重要的一点:普通人付出艰苦的努力,能成为天才吗?我不是心理学家,下面我仅就想针对软件开发来聊聊自己对这个问题的看法。
你能成为软件天才吗?在整个计算机领域,有一些老外的名字如雷贯耳:冯诺依曼,图灵,比尔盖茨、Anders Hejlsberg,在中国,诸如求伯君、柳传志、李开复等名人的故事也是众人皆知,虽然我们拿不到其智商测试的分数,但相信他们个个都是聪明人。
高智商其实是成为天才的必要条件。
相应的另一个结论就是:普通人再怎么努力,也成不了天才。
这话看上去令人泄气,但这是客观事实。
天才在各自领域内所达到的高度,大多数普通人是永远达不到的,比如如果有某人告诉我:你只要努力,就可以比Anders Hejlsberg还牛,读后感《软件天才与技术民工--薛涌《天才是训练出来的》读后感金旭亮》。
我一定会认为他在开一个让我很生气的玩笑。
回想起当年的高考,我费了九牛二虎之力,总分才刚够重点大学的最低分数线,后来的考研,我要考3次才侥幸过关,我也曾参过北大的博士生入学考试,结果惨败而回,以后知趣地不再尝试…,我就这智商,普通人一个,所以您就别忽悠我了,我才不信天天坚持跑步,日后就可以参加奥运会的马拉松比赛呢
个体间智商的差异是客观存在的。
但成为不了天才不能成为躺倒不干的理由。
因为这里有一个引发了巨大争论的问题…智商重要还是努力重要?国外心理学的统计数据明确无误地说明了智商的重要性,但这里有一个问题:就算是具有天才浅质的人在总人员的比例很少,但人类有数十亿之多,天才应该不少啊?怎么数千年来,公认天才的就是牛顿等那几个?1973年,诺贝尔经济学奖得言、人工智能研究的开拓者Herbert Simon和William Chase在研究国际象棋大师的成长规律时发现:再大的天才,也需要10年修炼成器。
音乐天才莫扎特似乎打破了这个十年定律。
5岁做曲,10岁登台演出,一生创作了数百部传世之作。
尽管如此,西方学者们还是发现,莫扎特6岁时就已经和父亲一起训练了3500个小时,他第一部达到大师水平的作品,创作年纪是21岁,实际上已经经历了18年的严格训练。
聪明的脑瓜是必要的,但仅有它也是不够的。
我引用了这么多的资料,其实只为了说明一个结果:不经十年寒窗,天才不可能出来。
本身具有高智商的人是这样,在平均智商上下的人更应该努力。
现在很好解释当下的一些现象了:(1)程序员为何是IT民工?因为这些所谓的程序员本身就没有具备从事软件开发的基本知识与基本技能,加上人数众多,可替换性强,怎么会不成为IT民工?(2)计算机专业学生为何就业难?很简单,一个计算机专业本科生,四年下来至少应该有4~6万行的代码量,但就我观察,达到这个要求的不到10%。
尽管软件开发行业需要较高的智商,但在平均学历为本科的软件开发行业,从业者已经过高考的筛选,智商并不是问题关键,之所以IT民工多和计算机专业学生就业难,主要问题是懒和训练不得法。
下图是我总结的一个靠技术吃饭的程序员知识与能力增长路线图:图2这个图不是针对天才设计的,而是针对一个普通的计算机专业大学生可能的主要人生经历绘制的,虽然经过了大量的简化,但主线还是很清楚的。
我成不了天才,那成为人材,可以吗?对这个问题,我的观点和薛涌先生在《天才是训练出来的》这本书中所表达的观点是一致的:完全可以。
我们需要解决的问题是如何努力的问题。
薛涌先生在书中介绍了一种名为处心积虑的训练(deliberation practice)的天才训练方法,这种方法是由天才研究的权威人士Ericsson教授提出的,简称为深练(deep practice),其意思是一般人练得浅,水平自然平庸,天才则练得深,所以能超出凡人之上。
普通人如果能科学地深练,虽然不能成为天才,但成为半个天才是完全可能的。
有关深练的介绍,朋友们可以自行去看《天才是训练出来的》这本书。
就我多年自学软件技术和8年的教学经验,我并不觉得深练有何奇特之处,我将深练总结为以下几句话:(1)织网:分解软件技术的大块知识为多个小的知识点,各个击破,将新知识与老知识联系起来,构造一张完整的可动态扩充的知识之网(2)训练:将开发技能给拆分为多个小的步骤或子技能,针对每个步骤或子技能反复地严格地训练,然后再这些步骤或子技能组合起来,以达到职业的水准。
(3)探究性的学习与实践:要将被动的学习转换为主动的探索,要通过开发实践把一切给激活。
我写了不少文章表达过自己针对软件技术学习的看法,在个人所写的几本书的前言中也比较系统地表达过类似的观点,这里就不再重复了,这些文章在我的个人博客上都可以找到。
而我也将在日后的开发与教学实践中应用这些原则,探索更有效的学习与训练方法。
下面,我们来看另一个很困扰人的问题:我是知道我成不了天才,但为何我也没成人材?我可从没偷懒过啊
这个问题太有中国特色了
这里面关键有几点:(1)你错过了学习天窗。
任何一种知识和技能,都有学习与培养它的最佳时间段,我们将它称为学习天窗,比如一个两三岁的小孩子可以轻而易举地学会两三种语言,而且不会有口音,而一个成人就够呛了,以英语为例,我们都受够了难听无比的日本英语和印度英语,中国英语也好不到哪去。
拿软件技术而言,最佳的学习时间是大学的这几年,18岁~25岁左右,精力、体力、智力,无不处于高峰,你这时不学,拿这个时间去玩游戏,看大片,QQ海聊,上网乱逛…,等到30岁以后再学,会发现你花3个小时才能记住的东西,10年以前可能1.5个小时(甚至更少的时间)就能记住了。
后悔也晚了。
这也只能怪你自己。
(2)命运:幸运的是,你生在中国
你没生在阿富汗和非洲,那里天天子弹飞,饿肚子,闹瘟疫,这种环境下你还能学计算机,编程序?倒霉的是,你也生在中国
如果你生在美国,你就可以摆脱那因为千军万马过独木桥而喘不过气来的中小学应试体制,上了大学,也可以得到比较好的专业引导和教育,避开那因为行政化而弊端从生的中国高等教育体制。
中国这个大环境你个人是改不了的。
最倒霉的是,你不仅生在中国,而且你爸不是李刚,你家在很远的地方,那地方很穷,家里买不起电脑,更别说上网了,你可能要到大学才第一次接触到电脑…,让你雪上加霜的是:你竞争不过那些学习条件好的同学,虽然你不笨,也很努力,但在起点就落后了,结果你没上到好大学,没碰到好老师,一步晚,步步晚…这不是你的责任,真的,不是你的责任
再追问下去,就要去宗教中寻找归宿了。
路在何方?你手上抓的牌不太好,这没办法,这是命运问题,老子说过:天地不仁,以万物为刍狗…别想那么多了,不抱怨不等待,积极努力,想办法把手头抓的这副坏牌打好,这是最现实最正确的选择。
只要个人努力了,其他的丢给命运吧
你还能怎的?本文来自CSDN博客,转载请标明出处:空间完美搬家到新浪博客
〔软件天才与技术民工--薛涌《天才是训练出来的》读后感金旭亮〕随文赠言:【这世上的一切都借希望而完成,农夫不会剥下一粒玉米,如果他不曾希望它长成种粒;单身汉不会娶妻,如果他不曾希望有孩子;商人也不会去工作,如果他不曾希望因此而有收益。
】
数据库应用技术【课程作业】
啥要求
正好有空,可以帮你
学软件技术出来后能做什么工作
很多
比如,程序员,网络工程师,硬件维修,可以说IT行业的任何岗位你都可以。
当然,科学数字化的今天可谓日新月异——甚至说是变得飞速得让人害怕
你在学校学的,肯定是基本的,理论的,是不够的——因为一般课程就是c语言啊,汇编啊什么的。
如果,你想在这些行业有作为的话,那么就趁现在,还在学校多下点功夫学习,拓展课本以外的东西;建议,从自己感兴趣的东西入手——比如吃啥
喝啥
等等都是非常重要的——做一个生活的学生,远远得到的突破大于任何的科技
计算机专业到底好不好?它是不是一份青春饭?
【编者按】:档案学就是探索档案、档案工作和档案事业的发展规律,研究档案信息资源的管理、开发的理论、原则与方法的学科。
精品学习网档案学栏目为您提供档案学范文参考,以及档案学写作指导和格式排版要求,解决您在写作中的难题。
浅谈数据库在档案管理中的应用[摘要]本文分析了数据库在档案管理中应用的现状与不足,讨论了利用数据库技术对档案进行管理的实现和应用,提出了有建设性的对策和建议,提出了自己的思考。
[关键词]数据库 档案管理 应用信息化是当今世界发展的大趋势,是推动经济社会发展和变革的重要力量。
随着我国各单位业务的急速发展,单纯的手工记录方式已无法及时有效地对档案材料进行收集、整理、立卷、归档和管理。
而计算机技术在近十年来的迅猛发展,使得各单位利用计算机对档案进行辅助管理成为可能。
档案信息化是在档案管理中全面应用现代信息技术,对档案信息资源进行开发、管理和提供利用等服务,主要包括档案资源数字化和网络化、档案信息管理和利用提供的一体化、档案信息的高度共享等。
《全国档案信息化建设实施纲要》规定了我国近期档案工作发展目标,《国家信息化发展战略(2006年—2020年)》的审议通过,为档案信息化提供了有力保障。
计算机的介入打破了传统的管理模式,使得原本松散、庞杂的档案管理迈入了集中统一、信息自动化的新领域。
虽然,利用计算机辅助管理档案能大量减轻管理工作的强度、提高管理工作的效率,并能减少管理工作的失误,但是由于计算机技术,尤其是数据库的发展是一个逐步开发、完善的过程,同时使用该技术的工作人员也有逐步学习、应用的阶段,因此计算机辅助管理各单位档案中也存在着不少需要解决的问题。
一、数据库在档案管理中应用的现状与不足随着各单位业务的不断扩大,传统的手工管理档案的方法,已经不能适应成倍膨胀的档案数量,也无法满足社会对档案的巨大利用需求,利用档案管理软件进行计算机管理是提高各单位档案服务水平的必由之路。
将手工管理的纸质档案转换为数字信息进入网络,即从档案的实态转换到虚拟态,档案信息与载体分离,在这个意义上说网络传递的仅是档案信息,用户得到的仅是复制品,而非档案原件。
使用数据库计算机辅助管理档案不同于以往对纸质文档进行收集、整理、立卷、归档、管理等工作,管理人员除了需要具备档案管理业务素质外,还需要对计算机及数据库应用具备一定的认识。
有相当多的档案管理工作人员知识结构老化,缺乏计算机技术知识,不能准确、规范地录入基本信息,导致基本信息错误、缺失甚至张冠李戴。
与此同时,由于一些档案管理软件在建立时仅考虑当时的数据量和用户需求,数据库结构中只有比较有限的几个数据字段,数据库容量较小,不能导出通用格式的数据。
当数据量成倍增加,数据库运行的速度就相应减慢,使工作效率被迫降低。
二、数据库在档案管理中的应用建议要全面提升档案数据库系统的安全水平是个艰难的过程,涉及方面很多,需要管理部门投入人量的人力物力。
有些方面,例如,设备的可靠性,火灾预防等方面,主要涉及投入力度的问题:防止人为的有意识破坏方面,如泄密监取密码口令、计算机病毒、黑客等,主要依靠管理制度和计算机安全专项技术。
但在数据库的一致性、完整性问题上,档案管理部门自身起着决定性作用。
主要应关注以下几点:1.采用科学的数据库开发方式早期使用结构化方法开发的档案管理软件,其稳定性、可修改性和可重用性都比较差,用户需求的变化往往造成系统结构的较大变化,并且需要花费很大代价才能实现这种变化。
新的档案管理软件可采用面向对象的程序设计方法,商定一种或多种数据转换方式,以便数据能够在不同软件之间实现信息共享。
考虑到信息网络化的需要,档案管理软件可具备通过网页进行数据查询、交换的功能。
同时还应考虑数据量增加的速度和数据库技术发展的趋势,以便今后对数据库进行升级或更新换代。
对于管理条例的各种文件可采用数码照相或者文本方式进行保存整理,通过公文类程序或网页进行交换及查询。
2.确保档案的保密性和安全性单位档案的保密性和安全性是十分令人关注的问题。
档案一旦进入计算机网络系统,网络的安全将直接关系到档案的保密性。
对于计算机网络与电子文件所存在的技术上的弱点只能靠技术上的发展去解决。
作为计算机网络的使用者,电子文件的形成者和保管者都有责任关注信息技术的最新发展,也有责任采用诸如防火墙、密码技术、网关、虚拟保险箱、电子印章、电子水印等最先进信息技术解决上述问题。
同时通过建立符合科研档案技术发展规律的各种工作规范来保障电子文件的安全。
只要工作规范,技术到位,这一科研档案工作的主要障碍是完全可以解决与克服的。
加强网络监控,及时备份数据。
网络中存在的安全性问题是对档案管理系统安全性最大的威胁。
目前有多种网络安全策略,各种安全策略必须相互配合才能真正起到保护作用,其中网络的访问控制可以说是保证网络安全最重要的核心策略,它的主要任务是保证网络资源不被非法使用和访问,它也是维护网络系统安全、保护网络资源的重要手段。
另外,要注意建立计算机检索查询和提供档案信息的主要服务方式,为使用者提供网状信息组织结构,使用户可以根据自己的意志沿着信息之间的关系链进行浏览,而不是按照规定途径进行检索和查询档案信息。
3.关注计算机病毒的新变化当档案信息系统扩展到局域网甚至互联网时,计算机病毒成为不可回避的危害,而且新型病毒具有许多网络时代的新特征,例如,病毒传播主要通过网络途径扩散,病毒与计算机入侵关系密切,Windows操作系统的网络功能是常见的攻击点,等等,档案工作者应当时刻注意新的技术变化,制定针对性策略,并从管理制度、技术监督、后备保护、应急措施等多方面综合防范。
4.加强法制建设保障档案信息安全单纯依靠档案管理部门自身的努力是不够的,还需要有相关法律、规章制度的约束。
因此,档案信息安全与其它社会问题一样,是一个复杂的综合性较强的问题,各个环节必须紧密衔接才能发挥作用。
立法在保障档案信息安全性中的作用是不言而喻的,缺乏法律支持的信息安全保障是纸上谈兵。
我国已将信息安全列入国家信息化发展战略,辽宁省早在1998年就通过了《辽宁省计算机信息系统安全管理条例)),这些都将在档案信息安全保障中发挥重要作用,但随着新问题的出现还需要更完善的、更专业的法律、法规出台。
参考文献:[1]张姝,韩振英.计算机在学籍档案管理中的应用[J].洛阳工业高等专科学校学报,1998,(4).[2]刘淑芬.计算机网络技术与学校档案管理[J].学校档案,1999,(1):23-25.[3]徐志敏.计算机技术对档案工作的影响[J].办公室业务,2000,(3):32-33.档案数据库建设中存在的问题及解决思路钱毅 摘要:档案数据库是档案信息资源管理的核心工具,目前我国档案数据库的建设和利用状况还存在不少问题。
作者首先解析了档案数据库的概念,指出应当从档案业务需求的角度去考察数据库的功能,并分析了档案实践的发展导致了档案数据库内容变化的几大因素。
在档案建设过程中存在的问题包括缺乏有效统筹规划、数据库定位不准确、标准规范缺失、数据质量不高等。
要解决这些问题,作者提出应当加强档案数据库规划管理、完善标准规范、建立健全质量控制体系、培养人才队伍等措施。
关键词:档案数据库 概念 问题 思路 数据库技术是20世纪60年代末发展起来的一门信息管理技术,是公认的信息资源开发、管理和服务的核心手段。
目前数据库的建设规模、信息量大小和使用频率已经成为衡量一个国家信息化水平和综合国力的重要尺度。
在我国国家和地方各级的档案信息化规划中,档案数据库作为档案信息资源管理的核心工具也都得到了广泛的重视。
但档案界一直存在着如何盘活档案资源、提高利用效率等问题。
应该说,拥有先进的数据组织技术和灵活可靠管理手段的数据库技术理论上可以从容面对这些挑战,为档案信息化搭建一个坚实的平台。
事实上几乎所有的档案信息管理系统的中心都由档案数据库来担当,无论其形式是档案辅助管理系统还是所谓的数字档案馆。
但档案数据库的建设和利用状况仍然不容乐观,还存在着数据结构封闭、数据质量不高,档案信息资源尚未完全走出信息孤岛的状态。
笔者拟从对档案数据库的概念、档案数据库的应用现状及建设思路几个方面来分析这些问题。
一、档案数据库概念解析 档案数据库的建设在我国已经有20余年的历史,但其理论发展却并不充分。
笔者通过期刊网()进行查阅,在1994~2005年间查询到篇名中包含“档案数据库”的文章仅有28篇①,内容多局限在实际工作总结的层次上,对档案数据库的概念描述和理论挖掘相对较少。
通过文献调研,笔者发现早在1987年孙淑扬就指出“档案数据库属于文献数据库,是档案自动化的重要内容,它是经过整理组织以机读形式出现的档案信息集合。
②”洪漪编著的《档案信息组织与检索》中认为“机读档案数据库,简称档案数据库,是以一定的组织方式存储在一起的机读档案数据的集合。
这些数据包括档案题名、责任者、来源、页码、分类号、主题词、摘要等,少数包含档案全文。
③”杨公之主编的《档案信息化建设实务》一书认为“档案数据库,从广义的角度讲,就是以特定方式组织起来的档案数据集合。
具体地讲,就是为了满足多个用户多种应用需要,按照一定的数据模型将本单位所保管的档案信息存贮在计算机中以备使用的数据形式。
④” 笔者无意为档案数据库给出一个确切的定义,因为作为支撑点的“档案”与“数据库”在实际应用中本身就是发散性很强的概念,而且还在不断发展变化之中,上述定义都符合其各自特定的信息背景,以致档案数据库在不同阶段的发展中出现了许多称谓,如机读目录数据库、索引数据库,照片档案数据库、全文数据库、多媒体档案数据库等等。
因此研究档案数据库,需要综合把握数据库和档案实践的发展,获得对档案数据库的相对完整的认识。
在研究数据库时,除了掌握其先进的管理手段和操作方法外,更重要的是要档案信息资源的特点,按照需求引导的原则关注数据库中可以“为我所用”的部分,而不能片面追求数据库功能而忽视基本的档案需求。
比如为了描述日益丰富的档案数据类型,我们要求数据库具有完备的数据类型能够表达音频、视频、全文等信息类型;为了加强档案数据质量控制,需要重点关注数据库的完整性管理机制;为了保证档案数据的安全,需要灵活应用数据库的视图功能、权限管理以及加密机制等。
此外,数据库提供的共享交换、格式转换、数据仓库等核心功能可以为档案数据库提升管理水平和管理层次都提供技术保障。
同时,我们还要关注档案实践活动的变化,关注这些变化可能对档案数据库带来的影响。
笔者认为影响档案数据库内容的主要因素有如下三个方面。
1.档案实体管理。
在近年的档案管理活动中出现了许多新情况,比如2000年出台的《归档文件整理规则》允许在文书档案实体管理活动中取消“卷”的概念,这直接影响到档案数据库是否还需要“卷”这一级逻辑层次,从而影响相关表的数据结构。
信息记录技术的发展引进了许多新型载体,目前纸张、照片、胶片、缩微胶片、硬盘、软盘、磁带、各类光盘、图纸等共存一室并不鲜见,不同类型的载体需要有不同的数据表来进行管理,档案信息化规划中还要求将这些载体的信息通过各种方式数字化后进入计算机系统,这也极大地丰富了档案数据库的内容。
此外,在档案信息利用环节,用户全文和多媒体信息检索需求也会促进档案数据库的数据类型的拓展。
2.档案数据库设计活动。
在多数情况下,档案数据库系统并不只是纯粹档案数据的集合,还包括档案管理活动中的其他信息,这些信息可以在数据库设计过程中被纳入管理。
比如,在使用数据流图等工具进行数据库需求分析的时候,可以将许多业务流程方面的管理信息纳入数据字典;数据库的概念设计阶段经常使用的ER模型(Entity-Relation Model)要求仔细分析档案管理域中各实体及其之间的联系,并据此建立档案数据库模式,通过这种设计方法得到的数据库通常还包括一些管理实体,比如包括各类人员库、标准库、组织机构表、保管期限表、人员权限表、库房信息等,甚至包括档案借阅者信息,而其中相当一部分不属于档案本体数据所包含的范围。
3.应用环境。
不同的机构具有不同的应用环境,像档案馆与一般业务部门的应用环境就有很大差别,它们对于档案数据具有不同的管理要求。
比如在信息集中管理应用环境中,为了管理方便,往往将档案与资料、期刊、报纸、图书等大量的非档案成分进行集中管理;文档一体化环境则将文件与档案数据共存一库,彼此依存,或者干脆就是合而为一;电子文件管理应用环境则根据前端控制原则,要求电子档案数据库的建设不能采用事后建库的方式,而必须深入到文件形成阶段,收集电子文件生命周期的完整信息。
因此可以看出,不同应用环境下建立的档案数据库的内容范围存在较大的差异。
通过简要分析档案数据库概念的内涵及其变化,笔者认为对于档案数据库的理解不能一刀切,而应该立足档案数据库建设单位的实际环境和系统需求,将包括档案实体信息、管理信息、应用环境信息在内的各种类型数据按照特定数据模型进行组织的数据集合,并以此为据来考察目前我国档案数据库存在的一些问题。
二、档案数据库建设中存在的问题 在档案信息系统的建设过程中,软硬件设施可以通过购买、引进而获得,但一个行业或者部门的信息资源是买不来的,只能依靠自己建设。
档案数据库作为档案信息资源采集、处理、存储和传输中心,在档案信息资源中占有举足轻重的作用。
因而从宏观上讲,如何规划设计档案数据库的建设,是关系档案信息化进程是否能够顺利进行的关键因素。
应该说,我们在这方面取得了很大的进步,数据库建设数量、分布的范围、发展的势头都是可喜的,初步消除了档案部门会沦为“信息孤岛”的疑虑。
但同时,许多档案数据库建设中的问题也浮上台面,能否解决好这些问题是关系档案数据库未来发展的关键。
1.档案数据库建设缺乏有效的统筹规划 档案数据库建设是档案信息资源开发的核心工作,但目前我国档案数据库建设缺乏有效的统筹规划。
在国家档案数据库建设层面上,除了明清、民国、革命历史档案资料三个目录中心的建设已经启动外,尚未有国家级档案数据库的规划安排,各地档案部门在实际建立档案数据库时基本上是各自为政,在档案数据标准体系尚不完善的情况下,这种局面将会导致数据共享困难。
虽然我国就档案数据库的建设也提出过总体指导意见,比如《全国档案信息化纲要》一文中多次提到档案数据库的建设问题,提出“加强档案目录数据库建设”、“进一步加强档案目录中心建设”、“积极推进档案全文数据库和多媒体数据库建设”等,但这些意见缺乏可操作性。
此外,如何将电子文件以及数字化档案的信息纳入档案数据库中进行管理,也需要在宏观层面上进行有效的统筹规划。
2.把握好数据库定位 也就是要回答好“建设什么样的档案数据库”的问题,回答这个问题需要充分了解档案数据库的内涵,明确建库的需求和目的,确定数据库定位,有的放矢。
数据库定位将直接影响到数据库的建设成本、规模、效能等,是进行档案数据库以及信息系统建设的一个基本出发点。
比如,是建立存储档案著录信息为主的目录数据库,还是建立存储档案全文的全文数据库;是根据馆藏的特点建立具有特色的数据库,还是基于馆藏图片、音像等资料建立综合 性多媒体数据库;是建立档案信息管理系统、文档一体化系统还是电子文档管理系统;是独立建库还是若干机构建立联合目录中心,或者是为未来的数字档案馆做数据准备。
这些问题都需要提前论证,做好决策。
而我们目前的档案数据库建设,在定位方面做的工作还不充分,许多数据库千篇一律,缺乏特色;或者数据库结构相似却不能联合,各自为战,造成资源分散,工作量重复。
3.数据库设计盲目性大,存在不科学的成分 数据库设计是一项非常严谨、科学性很强的一项工程,从可行性分析开始,逐次进行数据分析,绘制数据库的数据字典,然后运用各种工具进行概念模型设计、外模式设计和物理设计,最后才能装载数据库。
其中的各个步骤都必须认真对待,偏废不得,前一阶段的设计是下一阶段工作的基础,不适合跨越设计阶段开展工作。
但在实际的档案数据库设计过程中,还存在着许多不科学的问题。
特别在数据库可行性分析和数据分析阶段存在的随意现象比较突出。
许多设计者对繁琐的数据分析不太重视,往往一上来就开始设计库表结构,这种脱离详细分析的设计方法虽然表面上速度较快,但其质量经不起推敲。
对任何一个数据库系统而言,库表结构是其基石所在,基石不牢,大厦则有将倾之虞。
4.数据库逻辑结构缺乏规范 在进行数据库逻辑结构设计时,相关标准规范缺失是造成档案数据库的设计工作流于随意的主要原因,而档案数据库逻辑结构不规范的情况会引起数据库之间转换困难、难以共享等问题。
目前正在许多单位开展的数字化工作所形成的图像文件、视音频文件如何建库管理,目前尚未有相关规范出台。
电子文件管理元数据规范的滞后使得电子文件归档数据难以收集齐全,还有不少电子文件仍在进行人工著录登记,长此以往,前端控制原则难以在应用系统中得到应用。
而在字段结构层面上,不规范的情况则更为突出。
像在档案数据库中通常作为主键的“档号”字段的表示方法就五花八门,根据浙江省综合档案馆信息数据库建设调查报告的调查结果,在这浙江省通用的6种档案软件中,有的用4个字段来表示档号;有的定义成数字形式;有的定义为字符型,甚至同一个档案馆在不同时期录入的数据,表示形式也不统一。
这将对日后数据库迁移、目录中心数据合并等工作带来极大的困难。
5.数据质量 档案数据库的建设必须保证良好的数据质量,“问水哪得清如许,为有源头活水来”这句古诗启示我们,准确的数据库信息、良好的数据管理是营造档案数据库“一池清水”的先决条件。
作为重要的社会信息资源单位,档案部门必须高度重视档案数据质量,在追求数据库数量增长的同时,还要加强“污染防治”工作,防止脏数据的产生。
而根据浙江数据库现状调查报告,随机检查结果表明档案数据库质量较好的数据误差也在12%左右,总平均差错率达29%,造成这种状况的原因主要在录入阶段,同时数据库的质量检查制度不完善也是重要原因。
三、档案数据库发展中存在问题的解决思路 1.加强数据库建设规划管理 数据库建设是一项投入非常巨大、周期很长、事关信息化成败的基础工程,应当由档案事业管理部门提供宏观的指导方针,统筹规划,合理布局,提供本地区或本行业数据库建设的蓝图,并会同有关部门对数据库规划的可行性进行论证,提出档案数据建设的具体意见。
地方档案部门则根据宏观规划的要求进行详细设计,以实现全局共享为基础,突出特色数据。
基于这样的总体思路,可以建立大范围内协调一致的数据结构,数据库框架设计、数据内容都能得到很高的共享度,将会改善目前档案数据库建设自行一套、质量参差不齐的总体状况。
2.加强标准规范的建设 档案信息资源描述标准体系是建设档案数据库的重要保障,相关标准规范的确立和逐步完善有助于各级各类档案数据库需要保持必要的协调,共同为社会提供高效、优质的档案信息服务。
档案标准规范的制定要本着“确保数字档案资源格式统一、数据规范、长期可读、便于共享”的原则进行。
在实施过程中,应当积极采用国际标准和国外先进标准;一般性的信息处理标准优先采用国家标准,如《文献保密等级代码》、《全国行政区划代码》等标准应当直接采用国家标准,不必另行一套;对档案领域内特有的资源制定行业标准,如《寿险业务档案管理标准》。
此外为了保证国家文献系统标准之间的一致性,档案工作标准应尽量与图书、情报的国际、国内标准相一致。
3.建立标准的元数据库 目前数据库的逻辑结构设计比较混乱,虽然从各数据库个体角度观察,并没有太大的差错,但结构的不一致、不兼容会对数据库的共享和相互转换带来很大的困难,甚至难以进行。
笔者认为,这个问题的最终解决,依赖于以著录标准化为依托的元数据库的建设。
目前档案数据库的主要记录对象是档案文件的二次文献信息,即文件的著录信息。
许多档案数据库结构的确定其实就是将著录卡上的项目转换为数据表上的字段信息。
从原理上讲,这个过程应该很容易,但由于我国的《档案著录规则》,虽然规范了著录项目,但并没有规定相应的量化指标,离数据库系统所要求的结构化数据的要求还有相当距离。
由于著录标准并不是确定数据结构的强制标准,各档案数据库在建设时都可以根据自己的理解灵活应用,著录项目可以自行增删,字段类型、字段长度可以自由选择,这样的数据库进行互联互通的难度就可想而知了。
因此笔者建议以著录标准为基础,建立一定范围内的元数据标准,此处的元数据就是关于数据库中各数据字段的信息,并以此为基础构成元数据字典。
该字典提供数据项目的结构化信息,包括数据字段的名称、数据类型、长度、默认格式等规范,并说明字段之间的联系。
需要指出的是,这样一个具有内在联系的有机的元数据字典,实质上是为档案数据库提供通信格式,并不要求完全遵循,如果有特殊要求,只需要在此基础上提供转换功能即可。
随着档案信息化的深入,元数据字典的建设还应当包括全文和电子文件的元数据项目,为电子文件管理系统的设计提供相应的元数据,实现电子文档的前端控制,从而在根本上解决电子文档接口规范问题。
4.建立健全数据库质量控制体系 针对档案数据库数据质量的问题,笔者认为应当将档案数据库视作档案部门的信息产品,并依照生产产品的管理方式,通过质量控制体系进行监管。
该体系以可操作的方式提供对档案数据库的全面质量管理,包括数据库设计、建设、管理活动中主要环节的控制,并制定数据库质量考核指标体系。
该体系要求将数据库设计过程作为单独的项目进行管理,通过项目文档能够审查数据库设计过程是否科学、合理;能够对数据库建设过程中的人、财、物进行审计;对数据收集、录入、备份等各环节提供质检措施,保证数据准确、完整;通过质量指标体系对数据库容量、响应时间、查全率、查准率、错误率等进行核查。
依照质量控制体系进行管理,能够优化数据库管理活动,加强数据库建设人员的责任感。
5.加强档案数据库队伍建设 随着档案事业的不断推进,对档案信息管理人员的要求越来越高。
档案数据库作为档案信息化建设的中枢工程,其规划、设计、实施、管理、维护、标准建设等都需要相关人员具有较高的综合素质,不仅要熟悉馆藏,了解基本档案理论、业务流程、未来发展,还要掌握数据库管理的基本技能,对于档案数据库管理员,还需要具备一定的规划能力和标准化知识,而目前这方面的人才是比较缺乏的,需要档案部门和教育机构通力合作,培养通晓档案数据库建设的全面人才,全面推进档案信息资源的开发进程。
注释: ①查询时间:2005年9月16日,检索形式为“篇名”,检索模式为“精确检索”,数据库来源为“电子技术及信息科学辑目录”,特此说明。
②孙淑扬编著:《档案管理与计算机》,第176页,档案出版社1987年3月。
③洪漪编著《档案信息组织与检索》,第146页,武汉大学出版社,1998年1月。
④杨公之主编:《档案信息化建设实务》,中国档案出版社,2003年,第103页。
(原文载于《档案学通讯》2006年第4期)



