AI-大模型的可行性验证

大模型作为当前的前沿技术,有着强大的计算能力和复杂的数据处理能力,但是,面对大规模数据和高复杂度任务,模型的可行性如何?本文希望为大家提供了一个全面的视角,揭示了AI大模型在理论和实践中的潜力。
图片
随着信息技术的飞速发展,人工智能(AI)逐渐从科幻走向现实,成为驱动现代社会变革的核心力量。
AI大模型作为这一领域的前沿技术,凭借其强大的计算能力和复杂的数据处理能力,正引领着技术创新的潮流。
然而,面对大规模数据和高复杂度任务,这些模型的可行性和有效性究竟如何?
本文希望为大家提供了一个全面的视角,揭示了AI大模型在理论和实践中的潜力。
那么今天我们要做的是基于大模型进行证件过期,来进行实现思路构思和选型。
一、目标
基于身份证图片判断其是否过期。
二、OCR技术
OCR(Optical Character Recognition,光学字符识别)技术可以将各种票据、报刊、书籍、文稿及其他印刷品的文字通过扫描转化为图像信息,并利用文字识别技术将图像信息转化为可使用的文本。这项技术可以帮助我们从身份证图片中提取出有效的文字信息,用于后续的过期判断。
OCR:OCR技术是光学字符识别的缩写(Optical Character Recognition),是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其他印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的文本的计算机输入技术—–扫描图片转文字。
第一步:数据集准备
数据集准备-日常生活中首先我们收集身边人员。
#手机内容:身份证、居住证等符合场景要求的身份信息:例如身份证、驾驶证、护照、居住证、港澳通行证等。
#收集数量:10-30张
图片
“在收集到足够的数据后,接下来我们要进行数据汇总,以便后续的处理和分析。”
第二步:数据汇总
数据汇总方便我们后续对数据质量评价和应用,制作一个Excel表格,格式如下
首先我们可以将图片上传到云盘,获取图片链接。第二列为OCR结果复制粘贴
进去。
第三步:OCR提取
OCR 内容提取可行性验证,并不需要开发代码有界面,可操作交互的 OCR 产品即可腾讯 OCR:https://cloud.tencent.com/product/ocr
图片
第四步:大预言模型能力提取所需的关键信息
图片
注释:“Prompt工程是一种设计和改进AI提示的方法,以提高AI的表现。”
Prompt Engineering 是一种人工智能(AI)技术,它通过设计和改进 AI 的 prompt来提高 AI 的表现。Prompt Engineering的目标是创建高度有效和可控的 AI 系统,使其能够准确、可靠地执行特定任务。
因为人类的语言从根本上说是不精确的,目前机器还没法很好地理解人类说的话,所以才会出现 Prompt 工程这个技术。
·如果你是产品设计师,或者研发人员,你可以通过它来设计和改进AI系统的提示,从而提高AI系统的性能和准确性,为用户带来更好的AI体验。
第五步:迭代调优
输入OCR内容—查看结果—-调整Prompt—调整模型/参数—最后统一输出所有。
第六步:完善数据
把第三列输出结果补充进去,人工判断第四列是True正确还是False错误
第七步:整体效果评估
汇总样本统计 :样本数20
1. 精确率:95%
2. 召回率:100
精确率:对预测结果为正的样本中实际正确的个数
召回率:实际正样本中有多少被预测了回来
例如:面前有很多只狗和猫,扔一只骨头出去希望狗能跑过来精确率就是所有跑回来的动物中有多少只是狗,10只跑回来,其中有8只狗,精确率80%在所有的动物中有20只狗,召回率就是8/20.
图片
综上所述,通过《AI-大模型的可行性验证》,我们深入探讨了如何利用AI大模型和OCR技术来判断身份证是否过期。整个过程包括数据收集、OCR提取、模型应用及结果评估,展示了AI大模型在处理复杂数据任务中的优异表现。
在实际应用中,我们成功实现了高精度的身份证过期判断。在测试的20个样本中,我们达到了95%的精确率和100%的召回率,充分证明了AI大模型的潜力。例如,通过OCR技术,我们准确提取了身份证上的有效期信息,并通过大语言模型的分析,准确判断出身份证是否过期。
然而,在这个过程中也遇到了一些挑战。例如,部分OCR结果存在误识别问题,特别是在处理模糊或低质量图片时。此外,Prompt工程的设置和模型参数的调优也需要不断尝试和优化,以获得最佳的判断结果。面对这些挑战,我们通过不断迭代和改进,逐步提高了系统的准确性和可靠性。
尽管如此,我们仍需继续优化技术,解决在图像质量和识别准确性方面的不足,并加强对AI模型的道德审查和安全性测试。未来,随着技术的进一步发展,AI大模型有望在更多领域实现突破,带来更多创新和便利。
本文由 @李雪亮 投稿发布于人人都是产品经理,未经许可,禁止转载。
题图来自 Unsplash,基于CC0协议