欢迎访问喜蛋文章网
你的位置:首页 > 经典文章 > 文章正文

哪些技术和措施可以帮助建设开普勒 12b

时间: 2023-05-09 22:00:27 | 来源: 喜蛋文章网 | 编辑: admin | 阅读: 100次

哪些技术和措施可以帮助建设开普勒 12b

明代科学家徐光启的贡献有哪些

徐光启毕生致力于数学、天文、历法、水利等方面的研究,勤奋著述,尤精晓农学,译有《几何原本》《泰西水法》《农政全书》等著书。同时他还是一位沟通中西文化的先行者。为17世纪中西文化交流作出了重要贡献。
1、历法修订
2、编纂《崇祯历书》
3、数学应用
4、译《几何原本》
5、提倡农学引进番薯
6、编纂《农政全书》
7、练兵,造炮
8、撰写条令和法典
天文历法
徐光启在天文学上的成就主要是主持历法的修订和《崇祯历书》的编译。
编制历法,在中国古代乃是关系到“授民以时”的大事,为历代王朝所重视。 由于中国古代数学历来以实际计算见长,重视和历法编制之间的关系,因此中国古代历法准确的程度是比较高的。但是到了明末,却明显地呈现出落后的状态。一方面是由于西欧的天文学此时有了飞速的进步,另方面则是明王朝长期执行不准私习天文,严禁民间研制历法政策的结果。明沈德符《万历野获编》所说“国初学天文有历禁,习历者遣戍,造历者殊死”,指的就是此事。
明代施行的《大统历》,实际上就是元代《授时历》的继续,日久天长,已严重不准。据《明史·历志》记载,自成化年间开始(1481)陆续有人建议修改历法,但建议者不是被治罪便是以“古法未可轻变”,“祖制不可改”为由遭到拒绝。万历三十八年(1610)十一月日食,司天监再次预报错误,朝廷决定由徐光启与传教士等共同译西法。供邢云路修改历法时参考,但不久又不了了之。直至崇祯二年五月朔日食,徐光启以西法推算最为精密,礼部奏请开设历局。以徐光启督修历法,改历工作终于走上正轨,但后来满清侵入中原,改历工作在明代实际并未完成。
当时协助徐光启进行修改历法的中国人有李之藻(1565—1630)、李天经(1579—1659)等,外国传教士有龙华民、庞迪峨、熊三拔、阳玛诺、艾儒略、邓玉函、汤若望等。
《数联天地》
徐光启在天文历法方面的成就,主要集中于《崇祯历书》的编译和为改革历法所写的各种疏奏之中。《崇祯历书》的编译,自崇祯四年(1631)起直至十一年(1638),始克完成。全书46种,l37卷,是分五次进呈的。前三次乃是徐光启亲自进呈(23种,75卷),后二次都是徐光启死后由李天经进呈的。其中第四次还是徐光启亲手订正(13种,30卷),第五次则是徐氏“手订及半”最后由李天经完成的(10种,32卷)。
徐光启“释义演文,讲究润色,校勘试验”。负责《崇祯历书》全书的总编工作。此外还亲自参加了其中《测天约说》、《大测》、《日缠历指》、《测量全义》、《日缠表》等书的具体编译工作。
《崇祯历书》采用的是第谷(Tycho)体系。这个体系认为地球仍是太阳系的中心,日、月和诸恒星均作绕地运动。而五星则作绕日运动。这比传教士刚刚到达中国时由利玛窦所介绍的托勒玫(Pto1emy)体系稍有进步,但对当时西方已经出现的更为科学的哥白尼(Copernicus)体系,传教士则未予介绍。《崇祯历书》仍然用本轮、均轮等一套相互关联的圆运动来描述、计算日、月、五星的疾、迟、顺、逆、留、合等现象。对当时西方已有的更为先进的行星三大定律(开普勒三定律),传教士也未予介绍。尽管如此,按西法推算的日月食精确程度已较中国传统的《大统历》为高。此外《崇祯历书》还引入了大地为球形的思想、大地经纬度的计算及球面三角法,区别了太阳近(远)地点和冬(夏)至点的不同,采用了蒙气差修正数值。
在天文历法上,徐光启介绍了古代托勒玫旧地心说和以当代第谷的新地心说为代表的欧洲天文知识,会通当时的中西历法,主持编译了《崇祯历书》。在历书中,他引进了圆形地球的概念,明晰地介绍了地球经度和纬度的概念。他为中国天文界引进了星等的概念;根据第谷星表和中国传统星表,提供了第一个全天性星图,成为清代星表的基础;在计算方法上,徐光启引进了球面和平面三角学的准确公式,并首先作了视差、蒙气差和时差的订正。[2]
数学成就
“几何”名称的由来——科学家徐光启
学过数学的人,都知道它有一门分科叫作“几何学”,然而却不一定知道“几何”这个名称是怎么来的。在我国古代,这门数学分科并不叫“几何”,而是叫作“形学”。那么,是谁首先把“几何”一词作为数学的专业名词来使用的,用它来称呼这门数学分科的呢?这是明末杰出的科学家徐光启。
“几何”实际上“geometry”的音译,徐光启在经过反复诵读“geometry”后突然悟出与“几何”发音相近。精通汉学的利玛窦当即拍手叫好,遂一致确定“几何”为“geometry”的译名。
“几何”二字,在中文里原先也不是一个数学专有名词,而是个虚词,意思是“多少”。比如三国时曹操那首著名的《短
徐光启半身雕像
歌行》诗,有这么两句:“对酒当歌,人生几何?”这里的“几何”就是多少的意思。将“几何”借用来作为“数学专有名词”确实妙不可言。
徐光启在数学方面的成就,概括地说,有三个方面,即:
(1)论述了中国数学在明代落后的原因;
(2)论述了数学应用的广泛性;
(3)与意大利传教士利玛窦一起翻译并出版了《几何原本》。
中国古代数学源远流长,至汉代形成了以《九章算术》为代表的体系,至宋元时期达到发展的高峰,在高次方程和方程组的解法、一次同余式解法、高阶等差级数和高次内插法等方面都取得了辉煌的成就,较西方同类结果要早出数百年之久。但进入明朝以后,宋元数学的许多成果却几乎全都后继无人,逐渐衰废。对这种落后局面的形成原因,徐光启曾有十分精辟的分析。他说:“算术之学特废于近代数百年间耳。废之缘有二。其一为名理之儒士苴天下实事;其一为妖妄之术谬言数有神理,能知往藏来,靡所不效。卒于神者无一效,而实者亡一存,往昔圣人研以制世利用之大法,曾不能得之士大夫间,而术业政事,尽逊于古初远矣。”(“刻《同文算指》序”)
“名理之儒士苴天下实事”,对宋元数学在明代的衰废原因,可谓一语道破。
徐光启在一次关于修改历法的疏奏中,详细论述了数学应用的广泛性。他一共提出了十个方面(“度数旁通十事”),即:
(1)天文历法;(2)水利工程;(3)音律;(4)兵器兵法及军事工程;(5)会计理财;(6)各种建筑工程;(7)机械制造;(8)舆地测量;(9)医药;(10)制造钟漏等计时器。
可以说把数学应用的广泛性,讲述得十分完备。在300余年前,徐光启就能达到如此的认识,实属难能可贵。徐光启还曾建议开展这些方面的分科研究。如果每个学科都设置相应的机构,那将形成一个相当可观的“科学院”。
徐光启在数学方面的最大贡献当推《几何原本》的翻译。《几何原本》是古希腊数学家欧几里得(Euclid)在总结前人成果的基础上于公元前3世纪编成的。这部世界古代的数学名著,以严密的逻辑推理的形式,由公理、公设、定义出发,用一系列定理的方式,把初等几何学知识整理成一个完备的体系。《几何原本》经过历代数学家,特别是中世纪阿拉伯数学家们的注释,经阿拉伯数学家之手再传入欧洲,对文艺复兴以后近代科学的兴起,产生了很大的影响。许多学者认为《几何原本》所代表的逻辑推理方法,再加上科学实验,是世界近代科学产生和发展的重要前提。换言之,《几何原本》的近代意义不单单是数学方面的,更主要的乃是思想方法方面的。徐光启就正确的指出: “此书为益,能令学理者祛其浮气,练其精心,学事者资其定法,发其巧思,故举世无一人不当学。……能精此书者,无一事不可精,好学此书者,无一事不可学。”(《徐光启集·几何原本杂议》)直到20世纪初,中国废科举、兴学校,以《几何原本》内容为主要内容的初等几何学方才成为中等学校必修科目,实现了300年前徐光启“无一人不当学”的预言。
《几何原本》由公理、公设出发给出一整套定理体系的叙述方法,和中国古代数学著作的叙述方法相去甚远。徐光启作为首先接触到达一严密逻辑体系的人,却能对此提出较明确的认识。他说:“此书有四不必:不必疑、不必揣、不必试、不必改;有四不可得:欲脱之不可得,欲驳之不可得,欲减之不可得,欲前后更置之不可得。”他还说:“(此书)有三至、三能:似至晦,实至明,故能以其明明他物之至晦;似至繁,实至简,故能以其简简他物之至繁;似至难,实至易,故能以其易易他物之至难。”他最后说:“易生于简,简生于明,综其妙,在明而已。”(同上)徐光启提出《几何原本》的突出特点在于其体系的自明性。这种认识是十分深刻的。
历时一年,《几何原本》译出六卷,刊印发行。徐光启抚摸着此书,感慨道:这部光辉的数学著作在此后的一百年里,必将成为天下学子必读之书,但到那时候只怕已太晚了。
可历史,比他预感的更悲哀。
明朝时《几何原本》并没用得到重视, 致使徐光启逝世后《几何原本》迟迟不能翻译, 以至于被埋没。 后来明朝灭亡, 清统治者对此书并不关注 。康熙大帝虽然重视西学, 但是很可惜《几何原本》这样重要的著作还是没用,没能继续完成徐光启的遗愿。[2]
农学成就
徐光启出身农家,自幼即对农事极为关心。他的家乡地处东南沿海,水灾和风灾频繁,这使他很早就对救灾救荒感兴趣,并且讲究排灌水利建设。步入仕途之后,又利用在家守制、赋闲等各种时间,在北京、天津和上海等地设置试验田,亲自进行各种农业技术实验。
徐光启一生关于农学方面的著作甚多,计有《农政全书》(大约完成于1525—1528年间,死后经陈子龙改编出版于1639年)、《甘薯疏》(1608)、《农遗杂疏》(1612,现传本已残)、《农书草稿》(又名《北耕录》)、《泰西水法》(与熊三拔共译,16l2)等等。徐光启对农书的著述与他对天文历法的著述相比,从卷帙来看,数量虽不那样多,但花费时间之长、用功之勤,实皆有过之而无不及。
其中,《农政全书》又堪称代表。此书是徐光启殁后,经陈子龙删改(大约删者十之三,增者十之二)后成书的。《农政全书》共分12门(农本、田制、农事、水利、农器、树艺、蚕桑、蚕桑广类、种植、收养、制造、荒政),60卷,70余万言。书中大部分篇幅,是分类引录了古代的有关农事的文献和明朝当时的文献;徐光启自己撰写的文字大约有6万字。正如陈子龙所说,《农政全书》是“杂采众家”又“兼出独见”的著作,而时人对徐氏自著的文字评价甚高:“人间或一引先生独得之言,则皆令人拍案叫绝。”(刘献廷《广阳杂记》)
《农政全书》主要包括农政思想和农业技术两大方面,而农政思想约占全书一半以上的篇幅。徐光启的农政思想主要表现在以下几个方面:
(1)用垦荒和开发水利的方法来力图发展北方的农业生产。我国自魏晋以来,全国的政治中心常在北方,而粮食的供给、农业的中心又常在南方,每年需耗资亿万来进行漕运,实现南粮北调。时至明末,漕运已成为政府财政较大的隐患之一。徐光启主张发展北方农业生产来解决这一问题(垦荒、水利、移民等)。与此同时,在《农政全书》中,徐光启也用了四卷的篇幅来讲述东南(尤指太湖)地区的水利、淤淀和湖垦。他还对棉花在东南地区的种植、推广进行了不少研究。
(2)备荒、救荒等荒政,是徐光启农政思想的又一重要内容。他提出了“预弭为上,有备为中,赈济为下”的以预防为主(即指“浚河筑堤、宽民力、祛民害”)的方针。
农业技术方面:
(1)破除了中国古代农学中的“唯风土论”思想。“风”指的气候条件,“土”指土壤等地理条件,“唯风土论”主张:作物宜于在某地种植与否,一切决定于风土,而且一经判定则永世不变。徐光启举出不少例证,说明通过试验可以使过去被判为不适宜的作物得到推广种植。徐光启的有风土论但不唯风土论的思想,推进了农业技术的发展。
(2)进一步提高了南方的旱作技术,例如种麦避水湿、与蚕豆轮作等增产技术。他还指出了棉、豆、油菜等旱作技术的改进意见,特别是对长江三角洲地区棉田耕作管理技术,提出了“精拣核(选种)、早下种、深根短干、稀稞肥壅”的十四字诀。
(3)推广甘薯种植,总结栽培经验。
(4)总结蝗虫虫灾的发生规律和治蝗的方法。[2]
军事成就
徐光启幼年时期,其家乡一带屡遭倭寇蹂躏,因而从早年起即关心兵事。他在写给焦竑的一封信中说:“(光启)少尝感愤倭奴蹂践,梓里丘墟,因而诵读之暇稍习兵家言。时时窃念国势衰弱,十倍宋季,每为人言富强之术:富国必以本业,强国必以正兵。”(《徐光启集·复太史焦师座》)以农业为富国之本,以正兵为强国之本,徐光启正是基于这样的认识,一贯重视军事科学技术的研究。
早在刚刚被选考为翰林院庶吉士时,徐光启便在《拟上安边御虏疏》中提出了“设险阻、整车马、备器械、造将帅、练戎卒、严节制、信赏罚”,但他认为这些都不过是“世俗之常谈,国家之功令”。他这篇御敌疏的中心内容则是“于数者之中,更有两言焉。日求精,曰责实。……苟求其精,则远略巧心之士相于讲求,经岁而未尽;苟责其实,则忠公忧国之臣所为太息流涕者,十倍于贾谊而未已也”。“求精”和“责实”是徐光启军事思想的核心。
徐光启还大力宣扬管仲“八无敌”(材料、工艺、武器、选兵、军队的政教素质、练兵、情报、指挥)和晁错的“四预敌”(器械不利、选兵不当、将不知兵、君不择将”)。做到“八无敌”
徐光启上海徐家汇墓
即可无敌于天下,如果是“四预敌”则兵无不败。据此他提出了“极求真材以备用”。“极造实用器械以备中外守战”,“极行选练精兵以保全胜”,“极造都城万年台(炮台)以为永永无虞之计”,“极遣使臣监护朝鲜以联外势”(《徐光启集·辽左陷危已甚疏》)。这些办法和措施,都是“八无敌”、“四预敌”思想与“求精”、“责实”精神相结合的产物。尤其值得提及的是,徐光启和当时的登莱巡抚袁可立都是积极主张从战略上强化对朝鲜控制的少数军事战略家,无论从“抗倭”或“抗金”的立场上看和三百年后中国的“抗美援朝”是有异曲同工之妙的。
在上述这些办法和措施中,徐光启尤其注重对士兵的选练,他提出了“选需实选,练需实练”的主张。万历四十八年(1620)二月开始,徐光启受命在通州、昌平等地督练新军。在此期间他撰写了《选练百字诀》、《选练条格》、《练艺条格》、《束伍条格》、《形名条格》(列阵方法)、《火攻要略》(火炮要略)、《制火药法》等等。这些“条格”,实际上乃是徐光启撰写的各种条令和法典,也是我国近代较早的一批条令和法典。
《选练百字诀》和《选练条格》等等,体现了徐光启“实选”、“实练”的责实精神。
除此之外,徐光启还特别注重制器,非常关心武器的制造,尤其是火炮的制造。管状火器本是中国的发明创造,但时至明代末年,制造火器的技术已逐渐落后,由于边防的需要,急需引进火炮制造技术。为此,徐光启曾多方建议,不断上疏。徐光启还对火器在实践中的运用,对火器与城市防御,火器与攻城,火器与步、骑兵种的配合等各个方面部有所探求。徐光启可以称得上是中国军事技术史上提出火炮在战争中应用理论的第一个人

如何寻找外星人?最靠谱的三种方法

1、为了寻找外星人,人类都想了哪些办法?

1977年美国启动旅行者计划。旅行者一号开往蛇夫座方向,旅行者二号开往孔雀座的位置。或许你不明白,为什么要选在这一年呢?NASA可不是随便选个日子就把探测器扔出去了,因为这一年土星、天王星、海王星和冥王星正好在太阳系的同一侧。

旅行者飞跃这些行星,既可以观测这些行星,还可以利用引力弹弓效应进行加速,最大程度地节省燃料,可谓是一举两得。如果1977年不发射,下一次天时地利就要到2153年了。

现在旅行者的速度已经达到第三宇宙速度,理论上可以飞出太阳系,但是它目前还只是到了太阳的日球层,也就是太阳风吹得最远的地方。但是太阳系可不止这么大,在太阳系最外围包裹了一层彗星形成的尘埃云,叫奥尔特云。想要飞到奥尔特云,还要4万年。

旅行者号给外星文明捎上一份礼物,那是一张镀金唱片,上面刻写了太阳系的位置,和唱片的使用方法。唱片上记录了自然界的各种声音,还有55种语言的问候语以及世界各国的经典音乐。金唱片上还有一首中国古典音乐,它就是著名的高山流水。不知道外星人听到这种大气磅礴的音乐会有什么感觉。

旅行者一号和二号虽然被外星人发现的希望很渺茫,而且如果技术获得突破,很可能新的宇宙飞船几十年后就追上旅行者了。

接下来我们继续说寻找外星人的第二种方法,打电话给外星人。

2、如何实现跟外星人的通话?科学家们居然造出了巨大的话筒 。

1974年人类向距离地球25000光年的m13星云打了个电话。用的“话筒”直径有305米,是曾经最大的天文望远镜阿雷西伯。外星人如果回电话,那也得25000年后我们才能听到。

这是一串由1679个二进制数字组成的信息,包括人类的外形和太阳系的信息。但我觉得这段信息注定很难被接收到了,因为他们没有对准M78星云。

除了给外星人打电话,其实科学家们更热衷接外星人的电话。早在1960年美国一家非营利性的科研机构为了搜寻地外文明成立了一个(凤凰计划)。凤凰计划联合全球各个方位的射电望远镜全方位地搜寻地外信号并从中分析出有规律的 ,可能是地外文明发出的信息。

凤凰计划不仅是专业的科学家可以参与,业余的天文爱好者也可以参与。你只要有一个3-5平米的球面观察设备,就可以通过SETI的软件进行搜索。SETI总部会给每位成员分配天区,说不定你就会收到三句话:不要回答!不要回答!不要回答!

就算你没有球面观察设备。也可以下载SETI的软件用你的电脑帮助他们分析那些复杂的信号。1977年美国天文学家杰里·艾曼在俄亥俄州检测到一个明显的宽带无线电信号。这个信号不是太阳系的信号,它逐渐增强,然后衰减,一共持续了72秒。这是人类搜寻到的第一个不寻常的信号。

艾曼激动万分,在信号纸旁边写下了一个“WOW”,这就是著名的WOW信号。后来经过分析这个信号就来自我们的邻居人马座三星,所以三体人很可能真的存在。2021年曾经的最大射电望远镜阿雷西伯寿终正寝。而就在这一年,修建了22年的中国“天眼”FAST望远镜正式运行。FAST望远镜也接手了搜寻地外文明的任务。

而接下来的第三种就复杂一些了,它甚至可以帮助人类进行星际移民。

3、外星人的老家在哪?或许他们就在这些超级地球里。

超级地球顾名思义就是和地球很相似的星球。很多人说,生命的形式肯定不仅仅限于碳基生命,像什么硅基生命、气态生命、中子生命、等离子生命都是有可能存在的。但是我们寻找外星生命,肯定是先去找宇宙中已经存在的生命形式。这个道理就是你在大自然中已经找到了一只罕见的白虎,那找到另一只白虎的概率更大还是找到一只绿虎的概率更大呢?所以找到和人类相似的生命概率才是最大的。

当岩石行星绕恒星运转时,就会周期性地遮蔽恒星的一些光芒。通过望远镜观察这些现象就能知道这颗恒星到底有没有岩石行星,这就是宁日法。目前人类已经通过这个方法发现了4100颗类地行星,但是这些类地行星的质量不能比地球过大或者过小,过大就会吸引太多的气体成为类似木星的气态行星,质量过小就拉不住大气。因此这4100颗就像美女海选最后只剩下288颗身材和地球差不多的,再通过光谱分析这些行星的大气,就可以确定云层中有没有液态水,最后只剩下54颗看起来不是歪瓜裂枣。

2021年开普勒望远镜发现了一颗叫k2-12b的超级星球。它的质量是地球的八倍,极有可能存在液态水。开普勒望远镜观察了10万颗恒星,筛选出50颗超级地球,按照这个0.05%概率银河系有1250万颗有生命的星球,有6万颗可能有智慧生命的星球。而宇宙中有20000亿个星系,如此算来,宇宙中的早就布满了智慧生命。或许正如《三体》中的黑暗森林设定,我们找不到他们可能是因为他们都隐藏起来了。

而地球文明只不过是一个连新手村都还没走出的婴儿文明。当然,更多的人认为,其实我们根本不用找外星文明,因为他们可能早就来到地球上了。

下期再见!

大数据探究人类语言认知规律本质上是不是归纳法

  1 大数据兴起预示逗信息时代地进入新阶段
  1.1 看待大数据要有历史性的眼光
  信息时代是相对于农业和工业时代而言的一段相当长的时间。不同时代的生产要素和社会发展驱动力有明显差别。信息时代的标志性技术发明是数字计算机、集成电路、光纤通信和互联网(万维网)。尽管媒体上大量出现逗大数据时代地的说法,但大数据、云计算等新技术目前还没有出现与上述划时代的技术发明可媲美的技术突破,难以构成一个超越信息时代的新时代。信息时代可以分成若干阶段,大数据等新技术的应用标志着信息社会将进入一个新阶段。
  考察分析100年以上的历史长河可以发现,信息时代与工业时代的发展规律有许多相似之处。电气化时代与信息时代生产率的提高过程惊人地相似。都是经过20~30年扩散储备之后才有明显提高,分界线分别是1915年和1995年。笔者猜想,信息技术经过几十年的扩散储备后,21世纪的前30年可能是信息技术提高生产率的黄金时期。
  1.2 从逗信息时代新阶段地的高度认识逗大数据地
  中国已开始进入信息时代,但许多人的思想还停留在工业时代。经济和科技工作中出现的许多问题,其根源是对时代的认识不到位。18-19世纪中国落后挨打,根源是满清政府没有认识到时代变了,我们不能重犯历史性的错误。
  中央提出中国进入经济逗新常态地以后,媒体上有很多讨论,但多数是为经济增速降低做解释,很少有从时代改变的角度论述逗新常态地的文章。笔者认为,经济新常态意味着中国进入了以信息化带动新型工业化、城镇化和农业现代化的新阶段,是经济和社会管理的跃迁,不是权宜之计,更不是倒退。
  大数据、移动互联网、社交网络、云计算、物联网等新一代信息技术构成的IT架构逗第三平台地是信息社会进入新阶段的标志,对整个经济的转型有引领和带动作用。媒体上经常出现的互联网、创客、逗第二次机器革命地、逗工业4.0地等都与大数据和云计算有关。大数据和云计算是新常态下提高生产率的新杠杆,所谓创新驱动发展就是主要依靠信息技术促进生产率的提高。
  1.3 大数据可能是中国信息产业从跟踪走向引领的突破口
  中国的大数据企业已经有相当好的基础。全球十大互联网服务企业中国占有4席(阿里巴巴、腾讯、百度和京东),其他6个Top10 互联网服务企业全部是美国企业,欧洲和日本没有互联网企业进入Top10。这说明中国企业在基于大数据的互联网服务业务上已处于世界前列。在发展大数据技术上,我国有可能改变过去30年技术受制于人的局面,在大数据应用上中国有可能在全世界起到引领作用。
  但是,企业的规模走在世界前列并不表示我国在大数据技术上领先。实际上,国际上目前流行的大数据主流技术没有一项是我国开创的。开源社区和众包是发展大数据技术和产业的重要途径,但我们对开源社区的贡献很小,在全球近万名社区核心志愿者中,我国可能不到200名。我们要吸取过去基础研究为企业提供核心技术不够的教训,加强大数据基础研究和前瞻技术研究,努力攻克大数据核心和关键技术。
  2 理解大数据需要上升到文化和认识论的高度
  2.1 数据文化是一种先进文化
  数据文化的本质是尊重客观世界的实事求是精神,数据就是事实。重视数据就是强调用事实说话、按理性思维的科学精神。中国人的传统习惯是定性思维而不是定量思维。目前许多城市在开展政府数据开放共享工作,但是发现多数老百姓对政府要开放的数据并不感兴趣。要让大数据走上健康的发展轨道,首先要大力弘扬数据文化。本文讲的数据文化不只是大数据用于文艺、出版等文化产业,而是指全民的数据意识。全社会应认识到:信息化的核心是数据,只有政府和大众都关注数据时,才能真正理解信息化的实质;数据是一种新的生产要素,大数据的利用可以改变资本和土地等传统要素在经济中的权重。
  有人将逗上帝与数据共舞地归纳为美国文化的特点之一,说的是美国人既有对神的诚意,又有通过数据求真的理性。美国从镀金时代到进步主义时期完成了数据文化的思维转变,南北战争之后人口普查的方法被应用到很多领域,形成了数据预测分析的思维方式。近百年来美国和西方各国的现代化与数据文化的传播渗透有密切关系,我国要实现现代化也必须强调数据文化。
  提高数据意识的关键是要理解大数据的战略意义。数据是与物质、能源一样重要的战略资源,数据的采集和分析涉及每一个行业,是带有全局性和战略性的技术。从硬技术到软技术的转变是当今全球性的技术发展趋势,而从数据中发现价值的技术正是最有活力的软技术,数据技术与数据产业的落后将使我们像错过工业革命机会一样延误一个时代。
  2.2 理解大数据需要有正确的认识论
  历史上科学研究是从逻辑演绎开始的,欧几里得几何的所有定理可从几条公理推导出来。从伽利略和牛顿开始,科学研究更加重视自然观察和实验观察,在观察基础上通过归纳方法提炼出科学理论,逗科学始于观察地成为科学研究和认识论的主流。经验论和唯理论这两大流派都对科学的发展做出过重大贡献,但也暴露出明显的问题,甚至走入极端。理性主义走向极端就成为康德所批判的独断主义,经验主义走入极端就变成怀疑论和不可知论。
  20世纪30年代,德国哲学家波普尔提出了被后人称为逗证伪主义地的认识论观点,他认为科学理论不能用归纳法证实,只能被试验发现的反例逗证伪地,因而他否定科学始于观察,提出逗科学始于问题地的著名观点[3]。证伪主义有其局限性,如果严格遵守证伪法则,万有引力定律、原子论等重要理论都可能被早期的所谓反例扼杀。但逗科学始于问题地的观点对当前大数据技术的发展有指导意义。
  大数据的兴起引发了新的科学研究模式:逗科学始于数据地。从认识论的角度看,大数据分析方法与逗科学始于观察地的经验论较为接近,但我们要牢记历史的教训,避免滑入否定理论作用的经验主义泥坑。在强调逗相关性地的时候不要怀疑逗因果性地的存在;在宣称大数据的客观性、中立性的时候,不要忘了不管数据的规模如何,大数据总会受制于自身的局限性和人的偏见。不要相信这样的预言:逗采用大数据挖掘,你不需要对数据提出任何问题,数据就会自动产生知识地。面对像大海一样的巨量数据,从事数据挖掘的科技人员最大的困惑是,我们想捞的逗针地是什么看这海里究竟有没有逗针地看也就是说,我们需要知道要解决的问题是什么。从这个意义上讲,逗科学始于数据地与逗科学始于问题地应有机地结合起来。
  对逗原因地的追求是科学发展的永恒动力。但是,原因是追求不完的,人类在有限的时间内不可能找到逗终极真理地。在科学的探索途中,人们往往用逗这是客观规律地解释世界,并不立即追问为什么有这样的客观规律。也就是说,传统科学并非只追寻因果性,也可以用客观规律作为结论。大数据研究的结果多半是一些新的知识或新的模型,这些知识和模型也可以用来预测未来,可以认为是一类局部性的客观规律。科学史上通过小数据模型发现一般性规律的例子不少,比如开普勒归纳的天体运动规律等;而大数据模型多半是发现一些特殊性的规律。物理学中的定律一般具有必然性,但大数据模型不一定具有必然性,也不一定具有可演绎性。大数据研究的对象往往是人的心理和社会,在知识阶梯上位于较高层,其自然边界是模糊的,但有更多的实践特征。大数据研究者更重视知行合一,相信实践论。大数据认识论有许多与传统认识论不同的特点,我们不能因其特点不同就否定大数据方法的科学性。大数据研究挑战了传统认识论对因果性的偏爱,用数据规律补充了单一的因果规律,实现了唯理论和经验论的数据化统一,一种全新的大数据认识论正在形成。
  3 正确认识大数据的价值和效益
  3.1 大数据的价值主要体现为它的驱动效应
  人们总是期望从大数据中挖掘出意想不到的逗大价值地。实际上大数据的价值主要体现在它的驱动效应,即带动有关的科研和产业发展,提高各行各业通过数据分析解决困难问题和增值的能力。大数据对经济的贡献并不完全反映在大数据公司的直接收入上,应考虑对其他行业效率和质量提高的贡献。大数据是典型的通用技术,理解通用技术要采用逗蜜蜂模型地:蜜蜂的效益主要不是自己酿的蜂蜜,而是蜜蜂传粉对农业的贡献。
  电子计算机的创始人之一冯·诺依曼曾指出:逗在每一门科学中,当通过研究那些与终极目标相比颇为朴实的问题,发展出一些可以不断加以推广的方法时,这门学科就得到了巨大的进展。地我们不必天天期盼奇迹出现,多做一些逗颇为朴实地的事情,实际的进步就在扎扎实实的努力之中。媒体喜欢宣传一些令人惊奇的大数据成功案例,对这些案例我们应保持清醒的头脑。据Intel中国研究院首席工程师吴甘沙在一次报告中透露,所谓逗啤酒加尿布地的数据挖掘经典案例,其实是Teradata公司一位经理编出来的逗故事地,历史上并没有发生过[4]。即使有这个案例,也不说明大数据分析本身有什么神奇,大数据中看起来毫不相关的两件事同时或相继出现的现象比比皆是,关键是人的分析推理找出为什么两件事物同时或相继出现,找对了理由才是新知识或新发现的规律,相关性本身并没有多大价值。
  有一个家喻户晓的寓言可以从一个角度说明大数据的价值:一位老农民临终前告诉他的3个儿子,他在他家的地中埋藏了一罐金子,但没有讲埋在哪里。
  他的儿子们把他家所有的地都深挖了一遍,没有挖到金子,但由于深挖了土地,从此庄稼收成特别好。数据收集、分析的能力提高了,即使没有发现什么普适的规律或令人完全想不到的新知识,大数据的价值也已逐步体现。
  3.2 大数据的力量来自逗大成智慧地
  每一种数据来源都有一定的局限性和片面性,只有融合、集成各方面的原始数据,才能反映事物的全貌。事物的本质和规律隐藏在各种原始数据的相互关联之中。不同的数据可能描述同一实体,但角度不同。对同一个问题,不同的数据能提供互补信息,可对问题有更深入的理解。因此在大数据分析中,汇集尽量多种来源的数据是关键。
  数据科学是数学(统计、代数、拓扑等)、计算机科学、基础科学和各种应用科学融合的科学,类似钱学森先生提出的逗大成智慧学地[5]。钱老指出:逗必集大成,才能得智慧地。大数据能不能出智慧,关键在于对多种数据源的集成和融合。IEEE计算机学会最近发布了2021年的计算机技术发展趋势预测报告,重点强调逗无缝智慧(seamless intelligence)地。发展大数据的目标就是要获得协同融合的逗无缝智慧地。单靠一种数据源,即使数据规模很大,也可能出现逗瞎子摸象地一样的片面性。数据的开放共享不是锦上添花的工作,而是决定大数据成败的必要前提。
  大数据研究和应用要改变过去各部门和各学科相互分割、独立发展的传统思路,重点不是支持单项技术和单个方法的发展,而是强调不同部门、不同学科的协作。数据科学不是垂直的逗烟囱地,而是像环境、能源科学一样的横向集成科学。
  3.3 大数据远景灿烂,但近期不能期望太高
  交流电问世时主要用作照明,根本想象不到今天无处不在的应用。大数据技术也一样,将来一定会产生许多现在想不到的应用。我们不必担心大数据的未来,但近期要非常务实地工作。人们往往对近期的发展估计过高,而对长期的发展估计不足。Gartner公司预测,大数据技术要在5~10年后才会成为较普遍采用的主流技术,对发展大数据技术要有足够的耐心。
  大数据与其他信息技术一样,在一段时间内遵循指数发展规律。指数发展的特点是,从一段历史时期衡量(至少30年),前期发展比较慢,经过相当长时间(可能需要20年以上)的积累,会出现一个拐点,过了拐点以后,就会出现爆炸式的增长。但任何技术都不会永远保持逗指数性地增长,一般而言,高技术发展遵循Gartner公司描述的技术成熟度曲线(hype cycle),最后可能进入良性发展的稳定状态或者走向消亡。
  需要采用大数据技术来解决的问题往往都是十分复杂的问题,比如社会计算、生命科学、脑科学等,这些问题绝不是几代人的努力就可以解决的。宇宙经过百亿年的演化,才出现生物和人类,其复杂和巧妙堪称绝伦,不要指望在我们这一代人手中就能彻底揭开其奥妙。展望数百万年甚至更长远的未来,大数据技术只是科学技术发展长河中的一朵浪花,对10~20年大数据研究可能取得的科学成就不能抱有不切实际的幻想。
  4 从复杂性的角度看大数据研究和应用面临的挑战
  大数据技术和人类探索复杂性的努力有密切关系。20世纪70年代,新三论(耗散结构论、协同论、突变论)的兴起对几百年来贯穿科学技术研究的还原论发起了挑战。1984年盖尔曼等3位诺贝尔奖得主成立以研究复杂性为主的圣菲研究所,提出超越还原论的口号,在科技界掀起了一场复杂性科学运动。虽然雷声很大,但30年来并未取得预期的效果,其原因之一可能是当时还没有出现解决复杂性的技术。
  集成电路、计算机与通信技术的发展大大增强了人类研究和处理复杂问题的能力。大数据技术将复杂性科学的新思想发扬光大,可能使复杂性科学得以落地。复杂性科学是大数据技术的科学基础,大数据方法可以看作复杂性科学的技术实现。大数据方法为还原论与整体论的辩证统一提供了技术实现途径。大数据研究要从复杂性研究中吸取营养,从事数据科学研究的学者不但要了解20世纪的逗新三论地,可能还要学习与超循环、混沌、分形和元胞自动机等理论有关的知识,扩大自己的视野,加深对大数据机理的理解。
  大数据技术还不成熟,面对海量、异构、动态变化的数据,传统的数据处理和分析技术难以应对,现有的数据处理系统实现大数据应用的效率较低,成本和能耗较大,而且难以扩展。这些挑战大多来自数据本身的复杂性、计算的复杂性和信息系统的复杂性。
  4.1 数据复杂性引起的挑战
  图文检索、主题发现、语义分析、情感分析等数据分析工作十分困难,其原因是大数据涉及复杂的类型、复杂的结构和复杂的模式,数据本身具有很高的复杂性。目前,人们对大数据背后的物理意义缺乏理解,对数据之间的关联规律认识不足,对大数据的复杂性和计算复杂性的内在联系也缺乏深刻理解,领域知识的缺乏制约了人们对大数据模型的发现和高效计算方法的设计。形式化或定量化地描述大数据复杂性的本质特征及度量指标,需要深入研究数据复杂性的内在机理。人脑的复杂性主要体现在千万亿级的树突和轴突的链接,大数据的复杂性主要也体现在数据之间的相互关联。理解数据之间关联的奥秘可能是揭示微观到宏观逗涌现地规律的突破口。大数据复杂性规律的研究有助于理解大数据复杂模式的本质特征和生成机理,从而简化大数据的表征,获取更好的知识抽象。为此,需要建立多模态关联关系下的数据分布理论和模型,理清数据复杂度和计算复杂度之间的内在联系,奠定大数据计算的理论基础。
  4.2 计算复杂性引起的挑战
  大数据计算不能像处理小样本数据集那样做全局数据的统计分析和迭代计算,在分析大数据时,需要重新审视和研究它的可计算性、计算复杂性和求解算法。大数据样本量巨大,内在关联密切而复杂,价值密度分布极不均衡,这些特征对建立大数据计算范式提出了挑战。对于PB级的数据,即使只有线性复杂性的计算也难以实现,而且,由于数据分布的稀疏性,可能做了许多无效计算。
  传统的计算复杂度是指某个问题求解时需要的时间空间与问题规模的函数关系,所谓具有多项式复杂性的算法是指当问题的规模增大时,计算时间和空间的增长速度在可容忍的范围内。传统科学计算关注的重点是,针对给定规模的问题,如何逗算得快地。而在大数据应用中,尤其是流式计算中,往往对数据处理和分析的时间、空间有明确限制,比如网络服务如果回应时间超过几秒甚至几毫秒,就会丢失许多用户。大数据应用本质上是在给定的时间、空间限制下,如何逗算得多地。从逗算得快地到逗算得多地,考虑计算复杂性的思维逻辑有很大的转变。所谓逗算得多地并不是计算的数据量越大越好,需要探索从足够多的数据,到刚刚好的数据,再到有价值的数据的按需约简方法。
  基于大数据求解困难问题的一条思路是放弃通用解,针对特殊的限制条件求具体问题的解。人类的认知问题一般都是NP难问题,但只要数据充分多,在限制条件下可以找到十分满意的解,近几年自动驾驶汽车取得重大进展就是很好的案例。为了降低计算量,需要研究基于自举和采样的局部计算和近似方法,提出不依赖于全量数据的新型算法理论,研究适应大数据的非确定性算法等理论。
  4.3 系统复杂性引起的挑战
  大数据对计算机系统的运行效率和能耗提出了苛刻要求,大数据处理系统的效能评价与优化问题具有挑战性,不但要求理清大数据的计算复杂性与系统效率、能耗间的关系,还要综合度量系统的吞吐率、并行处理能力、作业计算精度、作业单位能耗等多种效能因素。针对大数据的价值稀疏性和访问弱局部性的特点,需要研究大数据的分布式存储和处理架构。
  大数据应用涉及几乎所有的领域,大数据的优势是能在长尾应用中发现稀疏而珍贵的价值,但一种优化的计算机系统结构很难适应各种不同的需求,碎片化的应用大大增加了信息系统的复杂性,像昆虫种类一样多(500多万种)的大数据和物联网应用如何形成手机一样的巨大市场,这就是所谓逗昆虫纲悖论地[6]。为了化解计算机系统的复杂性,需要研究异构计算系统和可塑计算技术。
  大数据应用中,计算机系统的负载发生了本质性变化,计算机系统结构需要革命性的重构。信息系统需要从数据围着处理器转改变为处理能力围着数据转,关注的重点不是数据加工,而是数据的搬运;系统结构设计的出发点要从重视单任务的完成时间转变到提高系统吞吐率和并行处理能力,并发执行的规模要提高到10亿级以上。构建以数据为中心的计算系统的基本思路是从根本上消除不必要的数据流动,必要的数据搬运也应由逗大象搬木头地转变为逗蚂蚁搬大米地。
  5 发展大数据应避免的误区
  5.1 不要一味追求逗数据规模大地
  大数据主要难点不是数据量大,而是数据类型多样、要求及时回应和原始数据真假难辨。现有数据库软件解决不了非结构化数据,要重视数据融合、数据格式的标准化和数据的互操作。采集的数据往往质量不高是大数据的特点之一,但尽可能提高原始数据的质量仍然值得重视。脑科学研究的最大问题就是采集的数据可信度差,基于可信度很差的数据难以分析出有价值的结果。
  一味追求数据规模大不仅会造成浪费,而且效果未必很好。多个来源的小数据的集成融合可能挖掘出单一来源大数据得不到的大价值。应多在数据的融合技术上下功夫,重视数据的开放与共享。所谓数据规模大与应用领域有密切关系,有些领域几个PB的数据未必算大,有些领域可能几十TB已经是很大的规模。
  发展大数据不能无止境地追求逗更大、更多、更快地,要走低成本、低能耗、惠及大众、公正法治的良性发展道路,要像现在治理环境污染一样,及早关注大数据可能带来的逗污染地和侵犯隐私等各种弊端。
  5.2 不要逗技术驱动地,要逗应用为先地
  新的信息技术层出不穷,信息领域不断冒出新概念、新名词,估计继逗大数据地以后,逗认知计算地、逗可穿戴设备地、逗机器人地等新技术又会进入炒作高峰。我们习惯于跟随国外的热潮,往往不自觉地跟着技术潮流走,最容易走上逗技术驱动地的道路。实际上发展信息技术的目的是为人服务,检验一切技术的唯一标准是应用。我国发展大数据产业一定要坚持逗应用为先地的发展战略,坚持应用牵引的技术路线。技术有限,应用无限。各地发展云计算和大数据,一定要通过政策和各种措施调动应用部门和创新企业的积极性,通过跨界的组合创新开拓新的应用,从应用中找出路。
  5.3 不能抛弃逗小数据地方法
  流行的逗大数据地定义是:无法通过目前主流软件工具在合理时间内采集、存储、处理的数据集。这是用不能胜任的技术定义问题,可能导致认识的误区。按照这种定义,人们可能只会重视目前解决不了的问题,如同走路的人想踩着自己身前的影子。其实,目前各行各业碰到的数据处理多数还是逗小数据地问题。我们应重视实际碰到的问题,不管是大数据还是小数据。
  统计学家们花了200多年,总结出认知数据过程中的种种陷阱,这些陷阱不会随着数据量的增大而自动填平。大数据中有大量的小数据问题,大数据采集同样会犯小数据采集一样的统计偏差。Google公司的流感预测这两年失灵,就是由于搜索推荐等人为的干预造成统计误差。
  大数据界流行一种看法:大数据不需要分析因果关系、不需要采样、不需要精确数据。这种观念不能绝对化,实际工作中要逻辑演绎和归纳相结合、白盒与黑盒研究相结合、大数据方法与小数据方法相结合。
  5.4 要高度关注构建大数据平台的成本
  目前全国各地都在建设大数据中心,吕梁山下都建立了容量达2 PB以上的数据处理中心,许多城市公安部门要求存储3个月以上的高清监控录像。这些系统的成本都非常高。数据挖掘的价值是用成本换来的,不能不计成本,盲目建设大数据系统。什么数据需要保存,要保存多少时间,应当根据可能的价值和所需的成本来决定。大数据系统技术还在研究之中,美国的E级超级计算机系统要求能耗降低1 000倍,计划到2024年才能研制出来,用现在的技术构建的巨型系统能耗极高。
  我们不要攀比大数据系统的规模,而是要比实际应用效果,比完成同样的事消耗更少的资源和能量。先抓老百姓最需要的大数据应用,因地制宜发展大数据。发展大数据与实现信息化的策略一样:目标要远大、起步要精准、发展要快速。

文章标题: 哪些技术和措施可以帮助建设开普勒 12b
文章地址: http://www.xdqxjxc.cn/jingdianwenzhang/170055.html
文章标签:可以帮助  措施  开普  建设  技术
Top