保险产品PDF费率表解析成excel

这件事情的背景

我们是一家AI创业公司,致力于让AI理解国内所有保险产品,结合用户自身的诉求,为用户提供养老规划、理财规划、教育规划。

需要你做什么

我们需要将每一款保险产品的费率表现价表解析成我们指定的格式,从而方便后面AI系统进行统一的数据分析。但由于保险公司提供的费率表现价表结构都不一样,所以就需要你写程序将原始的费率表现价表转换成我们指定的结构。

举个例子 – 费率表如何解析

保险公司提供的费率表长这样,并且都是PDF格式:

现在需要你写一个程序将PDF中的数据提取出来,并且按照如下结构存储成一份excel文件:

产出的这份excel文件包含如下几个字段:

  • age:投保年龄

  • sex:性别(是一个枚举,男用MALE表示,女用FEMALE表示)

  • insurance_period:保障期限,也就是这个保险产品能提供多久的保障,有两种表达方式,如果是以Y结尾,表示保障多少年,如果是以A结尾,表示保障至多少岁。注意:如果产品名字中有“终身”字样,说明这款产品是保障终身的,那么这个字段直接填999Y即可。

  • pay_frequency:交费频率,它是个枚举,枚举值如下

    • ONCE:一次性缴费(保险专业术语交“趸交”)

    • BY_YEAR:按年分期交费

  • pay_period:交费期限,也就是交多久,它也有两种表示方式:

    • 1Y:以Y结尾,表示交多少年

    • 70A:以A结尾,表示交到多少岁

  • amount:就是费率表中对应的数字值,也就是当前选项下对应的保费金额。

    • 注意:最终excel存储的amount单位是分,但费率表中的单位可能是元,需要做元->分的转化。

再举个例子 – 现价表如何解析

原始的现价表长这样:

现在需要将它转换成如下格式:

现价表的最终转换的结构其实和费率表类似,只不过多了一列:policy_year(保单年度)

交付流程是怎样的

如果决定开始,你将收到保险产品的压缩包,每个产品一个文件夹,每个文件夹下面分别会有费率表现价表两个PDF文件(说明书和条款请忽略),如下图所示:

收到这份产品清单后,你就可以开始按照上文所说的结构将PDF解析成我们指定结构的excel。

解析后的文件分别命名成费率表.excel现价表.excel放在每款产品各自的目录下即可,就像下图所示:

如何结算

每一批次任务完成后,我们将会对生成的费率表.excel现价表.excel执行测试用例,一般会有50条测试用例,通过测试验收的excel文件将按照每个excel文档5元的价格支付。

没通过测试用例验收的excel,修改过后重新提交,提交通过后依然会按照每个excel 5元的价格支付。

时效要求

前两周没有时效要求,可以熟悉流程、了解数据结构。

两周之后需要保证每周至少完成50个产品的解析(一个产品同时包含一张费率表和一张现价表)。

途傲科技为中小企业提供网站制作、网站建设、微信H5、微信小程序,多商户平台,多级分销系统,APP开发,手机网站,HTML5多端自适应网站,营销型企业站建设,及对技术人才的培养等都积累与沉淀了丰富的心得和实战经验。

如果您想定制同款软件,可以将需求提交给我们【免费提交需求,获取解决方案】

免责声明:文章部分内容收集于互联网,不代表本站的观点和立场,如有侵权请联系删除。

在线客服
途傲科技
免费获取方案及报价
2024-05-25 04:25:53
您好!欢迎来到途傲科技,我们致力于软件定制开发,核心团队拥有10年以上开发经验,项目案例1000+。 目前已合作客户有【中电金信】【中建土木】【齐鲁壹点】【中软国际】等。为了节省您的时间,您可以留下姓名,手机号(或微信号),产品经理稍后联系您,免费帮您出方案和预算! 全国咨询专线:18678836968(同微信号)。
🔥线🔥
您的留言我们已经收到,现在添加运营微信,我们将会尽快跟您联系!
[运营电话]
18678836968
取消

选择聊天工具: