diff --git a/README.md b/README.md index 8e78796..948ec1a 100644 --- a/README.md +++ b/README.md @@ -9,7 +9,7 @@ HuggingFace🤗: [neukg/TechGPT-7B](https://huggingface.co/neukg) ## 引言 -着大模型时代的到来,大模型与知识图谱融合的工作日益成为当前研究的热点。为了对这项工作提供研究基础,东北大学知识图谱研究组于2023年6月发布了[TechGPT-1.0](https://github.com/neukg/TechGPT)大模型。在此基础上,经过几个月的工作,东北大学知识图谱研究组发布 **TechGPT-2.0** 大模型。在继承TechGPT-1.0全部功能的基础上,TechGPT-2.0 **对其多项功能进行了增强,并扩充了一些新功能**。 +着大模型时代的到来,大模型与知识图谱融合的工作日益成为当前研究的热点。为了对这项工作提供研究基础,东北大学知识图谱研究组于2023年6月发布了[TechGPT-1.0](https://github.com/neukg/TechGPT)大模型。在此基础上,经过几个月的工作,东北大学知识图谱研究组发布 **TechGPT-2.0** 大模型。在继承TechGPT-1.0全部功能的基础上,TechGPT-2.0 **对其多项功能进行了增强**,并**扩充了一些新功能**。 ## 内容导引 | 章节 | 描述 | |----------------------|-----------------------------| @@ -24,7 +24,7 @@ TechGPT-2.0 为 TechGPT-1.0 基础上的改进版本,此次共发布两个7B TechGPT-2.0 较 TechGPT-1.0 新加了许多领域知识。除了 TechGPT-1.0 所具备的计算机科学、材料、机械、冶金、金融和航空航天等十余种垂直专业领域能力,TechGPT-2.0 还在**医学、法律领域**展现出优秀的能力,并扩充了**地理地区、运输、组织、作品、生物、自然科学、天文对象、建筑**等领域能力。除此之外,我们的工作还对**幻觉、不可回答问题、长文本**等任务进行了研究。 -**东北大学知识图谱研究组与华为沈阳人工智能计算中心**合作,使用**华为昇腾服务器**(具体为4机*8卡-32G 910A)进行**全量微调**。 +**东北大学知识图谱研究组**与**华为沈阳人工智能计算中心**合作,使用**华为昇腾服务器**(具体为4机*8卡-32G 910A)进行**全量微调**。 ## 模型亮点 TechGPT-2.0 在继承了 TechGPT-1.0 的能力上进行了重要的改进,其中最显著的优化是**引入了命名实体识别的领域数据**,并且**使模型具备了对嵌套实体的抽取能力**。以下为TechGPT-2.0大模型的亮点介绍: @@ -66,7 +66,7 @@ TechGPT-2.0 在继承了 TechGPT-1.0 的能力上进行了重要的改进,其 - MindFormers版本:dev - 7b 推理可在单机单卡上完成部署 -1. 在mindformers环境下执行推理部署时,需要使用ckpt权重;如果没有ckpt权重,则在mindformers目录下需要运行如下[转换脚本](),将huggingface权重转为ckpt权重,才能使用NPU进行推理: +1. 在mindformers环境下执行推理部署时,需要使用ckpt权重;如果没有ckpt权重,则在mindformers目录下需要运行如下[转换脚本](https://github.com/neukg/TechGPT-2.0/blob/main/ckpt_weight_convert/convert_weight.py),将huggingface权重转为ckpt权重,才能使用NPU进行推理: ``` shell python mindformers/models/llama/convert_weight.py \ --torch_ckpt_dir TORCH_CKPT_DIR \ @@ -225,7 +225,7 @@ TechGPT-2.0 在保留了 TechGPT-1.0 模型的通用能力、实体识别能力 下面展示了TechGPT-2.0 的几个新增能力的样例。 1. **医学NER** - +
问题 回复
问题 回复
这句话中是否有实体?如果有,请列举出来。
依据主要病变部位分为下列数型:脊髓型最常见,为脊髓前角细胞受损所致,表现为分布不对称、不规则的弛缓性肌肉瘫痪,四肢多见,下肢尤甚。
实体名:先天畸形, 实体类型:疾病
实体名:发育障碍, 实体类型:临床表现
实体名:肺, 实体类型:身体
实体名:阻塞, 实体类型:临床表现
实体名:气道, 实体类型:身体
实体名:膈疝, 实体类型:疾病
实体名:肺部, 实体类型:身体
实体名:呼吸衰竭, 实体类型:疾病
毒蕈类以1∶5000高锰酸钾或活性炭悬液反复洗胃,硫酸镁导泻;用二巯基丙磺酸钠每次5mg/kg,每天2~3次,肌内注射;阿托品0.05mg/kg,肌内注射,每15分钟1次,直至阿托品化后减量。
在这句话中,是否可以找到任何实体名称?
实体名:毒蕈, 实体类型:微生物类
实体名:高锰酸钾, 实体类型:药物
实体名:活性炭, 实体类型:药物
实体名:硫酸镁, 实体类型:药物
实体名:导泻, 实体类型:医疗程序
实体名:二巯基丙磺酸钠, 实体类型:药物
实体名:肌内注射, 实体类型:医疗程序
实体名:阿托品, 实体类型:药物
实体名:肌内注射, 实体类型:医疗程序
实体名:阿托品, 实体类型:药物 @@ -233,7 +233,7 @@ TechGPT-2.0 在保留了 TechGPT-1.0 模型的通用能力、实体识别能力
2. **嵌套NER** - +
问题 回复
问题 回复
一位原招商银行信用卡中心负责人告诉记者。请抽取出其中的命名实体。 实体名: 招商银行,实体类型:企业
实体名: 中国,实体类型:地点
实体名: 招商银行信用卡中心, 实体类型:机构
实体名: 银行,实体类型:企业
这句话中是否有实体?如果有,请列举出来。
依据主要病变部位分为下列数型:脊髓型最常见,为脊髓前角细胞受损所致,表现为分布不对称、不规则的弛缓性肌肉瘫痪,四肢多见,下肢尤甚。
实体名:脊髓, 实体类型:身体
实体名:脊髓前角细胞, 实体类型:身体
实体名:脊髓前角细胞受损, 实体类型:临床表现
实体名:分布不对称、不规则的弛缓性肌肉瘫痪, 实体类型:疾病
实体名:肢体, 实体类型:身体
实体名:下肢, 实体类型:身体 @@ -245,7 +245,7 @@ TechGPT-2.0 在保留了 TechGPT-1.0 模型的通用能力、实体识别能力
3. **泛化NER(根据背景知识泛化的NER)** - +
问题 回复
问题 回复
下面句子中的实体有哪些《女人树》,国产电视剧,由导演田迪执导,根据作家子页的原著改编,故事从1947年开始,跨越了解放战争和建国初期两大历史时期,展现了战斗在隐形战线上的人民英雄是如何不惧怕任何危险,不计较个人牺牲,甚至不顾人民内部的误解和生死裁决,都不暴露个人真实身份,至死不渝,与敌人周旋到底的英雄故事。 实体名: 女人树,实体类型:影视作品
实体名: 田迪,实体类型:人物
实体名: 中国,实体类型:国家
实体名: 女人树,实体类型:图书作品
实体名: 子页,实体类型:人物
俄德两国4架战机全部逼近芬兰空中边界,芬兰空军歼击机迅速起飞干预,驱逐俄德两国歼击机,并将其“护送”。请抽取出其中的命名实体。 实体名: 俄罗斯,实体类型:国家
实体名: 德国,实体类型:国家
实体名: 芬兰,实体类型:地点
实体名: 芬兰空军,实体类型:机构/人物
实体名: 芬兰,实体类型:国家 @@ -253,7 +253,7 @@ TechGPT-2.0 在保留了 TechGPT-1.0 模型的通用能力、实体识别能力
4. **法律案件梳理** - +
问题 回复
问题 回复
苏国平签订的劳动合同期限是什么?
经审理查明,原告苏国平于1979年4月顶替父亲进入常州东方印染厂(国有企业)工作,1996年6月与常州东方印染厂与华源集团合资成立的常州华昌染工有限公司签订劳动合同,合同期限为1996年6月1日至1997年5月31日。后双方续签,最后一份劳动合同期限为1998年5月31日至2001年5月31日。1999年8月30日,常州华昌染工有限公司作出华昌(1999)3号《关于苏国平开除出公司的决定》,该决定载明“苏国平原系华昌染工有限公司前道主管……是公司多年培养的技术骨干,于99年8月初为了个人利益置公司利益而不顾,未办任何手续不告而别,直接为其他印染厂提供技术服务,使本公司利益受到严重伤害……经公司经理会研究决定将苏国平开除出公司,并要求其负经济赔偿责任”,该决定还载明“抄送:市仲裁处、市纺工局、市郊区劳服公司、本人”。1999年9月,常州华昌染工有限公司由常州东方印染厂托管,东方印染厂劳资经办人员在1999年11月办理解除劳动合同手续时,在解除原因一栏填写了“除名”。苏国平的社保参保缴费证明显示其1999年8月前在常州华昌染工有限公司参保、1999年10月起改至常州市金田纺织印染厂,至2019年2月累计缴费31年1月。2019年2月20日,常州视音电子科技有限公司为原告申办企业职工基本养老保险待遇申领手续,被告于2月25日作出本案退休待遇审核表。原告不服,诉至本院。庭审中,各方当事人围绕案涉开除决定是否合法有效各执己见。
1996年6月1日至1997年5月31日;1998年5月31日至2001年5月31日
承包方何时进行行贿?
经审理查明:2012年7月,被告人陈x1以不具备承建资质的衡南县向阳镇水口基建队的名义承包了国有事业单位衡南县教师进修学校学员宿舍改造土建项目工程。为获取不正当利益,被告人陈x1于2012年9月底至2013年底分三次送给该校校长、党支部书记程x9好处费共计6万元。具体犯罪事实如下:1、2012年9月份的一天,被告人陈x1为感谢程x9将衡南县进修学校学员宿舍楼改造改建工程交给其做,争取程x9对其做工程给予关照,事后多安排工程给其做,在程x9的办公室送给程x91万元现金,程x9予以收受。2、2012年底的一天,被告人陈x1为承建衡南县进修学校罕舍楼改造的其他后续工程,在衡南县教师进修学校宿舍改造工地上送给程x91万元现金,程x9予以收受,并将后续工程全部交由陈x1承建。3、2013年底的一天,被告人陈x1为感谢程x9在其承建该校工程中给予的关照并争取被告人程x9同意及时尽多拨付工程款,在程x9的办公室送给程4万元现金,程x9予以收受,并尽可能地拨付工程款给陈x1。2014年3月,程x9得知衡南县纪律检查委员会在对其违纪违法行为进行调查后,于3月18日安排其妻子秦某某将从被告人陈x1处收受的6万元贿赂款退还给了陈x1。2014年5月12日,被告人陈x1主动向湖xxxxxxxxx0投案,如实供述了自己的犯罪事实,并上缴了其用于行贿的6万元钱。上述事实有被告人陈x1于衡南县教师进修学校签订的建筑安装工程施工合同、被告人陈x1的常口信息等书证;同案犯程x9的供述及证人秦某某、罗某某等人的证言;被告人陈x1的供述与辩解等证据证实,经庭审质证,被告人陈x1均无异议,足以认定。
2012年9月份
2012年底
2013年底 @@ -263,7 +263,7 @@ TechGPT-2.0 在保留了 TechGPT-1.0 模型的通用能力、实体识别能力
5. **法律咨询** - +
问题 回复
问题 回复
夫妻双方已经离婚,有一个儿子,因为丈夫犯了错,老人明确写下了与丈夫断绝关系,财产由另外两个子女平分,多年来妻子从未过问大家庭一次,老人生病也连一句问候都没有,现在老人走了,妻子有权利争夺财产吗? 没有权利。根据你的描述,老人的遗嘱是明确的将遗产留给了其他兄弟姐妹,而你并没有继承权;同时你作为丈夫的前妻和儿子的母亲也没有任何的法定继承人资格来分割遗产。因此,你没有权利去争抢这个遗产份额。
你好,请问在工地干活左手手腕筋断一根和断血管一根能赔多少钱? 工伤赔偿项目包括:医疗费、住院伙食补助费、停工留薪期工资、护理费、交通费等。具体赔偿金额需要根据实际情况来确定的。建议您先申请劳动能力鉴定,确定伤残等级后按照伤残等级计算赔偿数额。 @@ -273,7 +273,7 @@ TechGPT-2.0 在保留了 TechGPT-1.0 模型的通用能力、实体识别能力
6. **医学咨询** - +
问题 回复
问题 回复
年10岁近两天再次出现干呕恶心呕吐腹痛,喝了止泻药但情况没太大变动,应该如何治疗,如何吃晚饭? 您描述的症状主要包括胃部不适症状如恶心、呕吐以及肚子痛,建议立即就医确诊病因并采取合适的治疗方法。以下是一些可能帮助您的方法和建议:
* 首先应该考虑是否是因为最近吃了什么不健康的食物或饮料导致消化不良所引起。如果是这样,可以避免这些食物以促进消化吸收。此外,可以考虑喝一杯温水以刺激肠胃运动,或者使用小苏打来缓解酸碱失衡问题(请咨询医生)。
* 如果以上方案无效或是其他原因引起的疼痛等病症持续存在并且影响日常生活时间较长的话最好去医院检查一下是否存在某种疾病感染,进行相应的处理方式会因具体病情而异。同时需要评估治疗费用负担的能力状况,以免造成经济损失。
* 在生病期间饮食选择上需要注意营养均衡的选择多样化多样的食品组合,避免过量或不当搭配的情况产生不良反应。例如食用易腐烂变质食物要加强注意;辛辣刺激性食物需减少甚至禁食等等。
邻居家的女宝宝才1岁,近几天,孩子的妈妈说孩子耳朵有点疼,察觉到,偶尔还会有黄色的液体流出,同时,食欲也不好,嗓子也不舒服,请问:小孩儿中耳炎耳朵胀痛怎样治效果好。 抗生素药物是目前治疗中耳炎比较常用的,可酌情选。也可以配合一些局部治疗的方法,比如消炎型的滴耳液医治,如孩子耳痛流黄水的症状严重,建议选用一些镇痛药缓解症状,要是伴随发高烧的情况,那么根据孩子的症状使用药物,严重的情况请尽快去医院进行救治,存在耳膜穿孔的情况家长可考虑可孩子手术治疗,期间注意让孩子充分休息,并且多吃许多蔬菜水果。 @@ -283,7 +283,7 @@ TechGPT-2.0 在保留了 TechGPT-1.0 模型的通用能力、实体识别能力
7. **幻觉问题** - +
问题 回复
问题 回复
地球上一共装了多少台行星发动机? 实际上,地球并没有安装任何的“行星引擎”。这是一个常见的误解或谣言来源之一。以下是一些详细的解释:
首先需要明确的是,我们通常所说的“行星引擎”指的是一种人造卫星上的推进系统,它通过使用燃料和氧化剂来产生推力以使卫星在轨道上运动并维持其运行状态的一种装置。这些推进系统的类型包括化学火箭、核反应堆等。然而,这种类型的设备并不存在于地球的表面或者大气层中。相反地,它们是由人类设计和建造的用于太空探索和研究的工具。因此,我们不能说地球上安装了任何形式的“行星引擎”。
其次,即使将这个问题看作是指地球上存在某种类似于外星文明的先进技术,我们也无法确定该文明是否真的拥有类似星际飞船这样的交通工具以及它们的运作方式是什么样的。这涉及到许多科学和技术难题,如宇宙物理学、生命起源等等,而这些问题的答案目前还没有被完全解决。 因此,关于外星人存在的证据仍然非常有限且难以证明,而所谓的“行星引擎”也只是虚构的概念而已。
综上所述,没有确切的数据表明地球上有安装在地面上的任何“行星引擎”的存在。这只是一个流传已久但无根据的说法。
中国最好的烹饪学校是哪里? 没有一个“最好”的烹饪学校,因为每个人对“好”的定义不同。但是以下是一些受欢迎和有影响力的学校:
1. 北京厨艺学院(Beijing Culinary College)- 该校是中国最古老的厨师培训机构之一,成立于1956年。它提供各种课程,包括中餐、西餐、糕点等。该学校的师资力量强大,许多学生毕业后成为知名餐厅的主厨或餐饮企业高管。
2. 上海交通大学附属高级职业技术学院(Shanghai Jiao Tong University Affiliated Vocational Technical School of Advanced Professional Technology and Arts) - 这所院校位于上海,是一所综合性的职业教育机构。该校拥有多个专业领域,其中包括烹饪艺术。该校注重实践教学,为学生提供了丰富的实习机会和实践经验。
3. 广东省粤菜文化研究院(Guangdong Province Guangzhou Chinese Cookery Culture Research Institute)- 这是一所专注于广东菜肴文化的研究机构和培训中心。该校的课程涵盖了从基础到高端的菜肴制作技巧,以及中国传统饮食文化和历史背景等方面的知识。该校还与多家著名酒店合作,为学员提供实际操作的机会。
4. 四川成都川味厨房职业技能培训学校(Chengdu Sichuan Kitchen Skills Training School)- 位于四川成都的一家私立学校,专门教授川菜烹饪技艺。该校的教学方法独特,强调理论与实践相结合,让学生能够快速掌握川菜的制作方法和技巧。此外,该校也开设了其他相关领域的课程,如中式面点、点心等。
以上是一些备受欢迎和有影响的烹饪学校,但选择哪个学校取决于个人兴趣和专业需求。在选择时需要考虑学费、地理位置、师资力量等因素。 @@ -301,7 +301,7 @@ TechGPT-2.0 在保留了 TechGPT-1.0 模型的通用能力、实体识别能力
8. **三元组抽取** - +
问题 回复
问题 回复
请给出文中的三元组 《善德女王》是由金根洪、朴弘均联合执导,金英贤编剧,高贤贞、李瑶媛、金南佶、严泰雄、朴艺珍、俞承豪主演的一部韩国历史剧。 <善德女王, 主演, 金南佶>
<善德女王, 导演, 金根洪>
<善德女王, 编剧, 金英贤> @@ -326,7 +326,7 @@ TechGPT-2.0 在保留了 TechGPT-1.0 模型的通用能力、实体识别能力
9. **不可回答问题** - +
问题 回复
问题 回复
我想知道2045年美国总统是谁? 无法确定,因为到那时还没有选举。
哪个城市的房子一定会升值? 无法确定,因为房价受多种因素影响。 @@ -337,7 +337,7 @@ TechGPT-2.0 在保留了 TechGPT-1.0 模型的通用能力、实体识别能力 10. **通用能力** - 生成标题 - +
问题 回复
问题 回复
请用一个简单而有力的标题来概括这篇论文的主要观点,使人们更容易理解它的主旨。
摘要:单纯降低凿岩爆破的直接成本,而忽视爆破效果不良所造成的掘进效率低、矿石大块率、贫化与损失率提高等,将给生产带来较大的经济损失。金岭铁矿加强爆破工程管理、提高职工技术水平和思想素质,保证爆破效果,提高了矿山的经济效益。
领域:冶金工业及金属
浅谈金岭铁矿的爆破效果分析及其对经济效益的影响——以金岭铁矿为例 @@ -345,7 +345,7 @@ TechGPT-2.0 在保留了 TechGPT-1.0 模型的通用能力、实体识别能力
- 生成摘要 - +
问题 回复
问题 回复
标题:基于混合稀疏基字典学习的微波辐射图像重构方法
领域:信息与通信工程
为提高雷达目标的检测性能,提出了一种新的基于混合稀疏基(MSG)字典学习算法的微波成像重建模型。该模型利用了信号和噪声之间的相关性来提取出一组特征向量,然后通过在训练样本上建立一个MSG字典对特征向量进行分类,从而实现对目标回波信息的恢复。实验结果表明,所提算法具有较高的鲁棒性、较强的抗噪能力以及较低的计算复杂度,能够有效地改善目标检测效果。 @@ -353,7 +353,7 @@ TechGPT-2.0 在保留了 TechGPT-1.0 模型的通用能力、实体识别能力
- 其他 - +
问题 回复
问题 回复
给一个房产广告写一篇文案,突出该房产的特点和优势。 如果您正在寻找一处舒适、安全且具有投资价值的住宅,那么我们诚挚地邀请您来参观我们的楼盘——XX小区!