当前位置: 首页 > news >正文

有什么网站可以做代理的线上卖货平台有哪些

有什么网站可以做代理的,线上卖货平台有哪些,好看的网站都找谁做的,建设银行理财产品网站在这个项目中,我的目标是从科学论文图片中提取某些部分(标题、作者和摘要)。预期提取部分是科学论文中常见的部分,例如标题、摘要和作者。输入与最终结果。我的输入是将第一页纸转换成图像。最终结果是一个 txt 文件,其中包含标题、作者和摘要部分,如下图1和图2所示。我将…

在这个项目中,我的目标是从科学论文图片中提取某些部分(标题、作者和摘要)。预期提取部分是科学论文中常见的部分,例如标题、摘要和作者。输入与最终结果。我的输入是将第一页纸转换成图像。最终结果是一个 txt 文件,其中包含标题、作者和摘要部分,如下图1和图2所示。我将使用 UNet 来了解在哪里可以找到这些部分,然后将训练学到的信息传递到 OCR 中。完整的项目可以在这里找到。

图1 要提取的论文首页(图片格式) 

图2  提取得到的论文标题、作者和摘要

步骤说明

我从数据收集和科学论文开始。由于我只对标题、摘要和作者这三个部分感兴趣,所以我选择了多篇论文中的第一页。然后我将其转换pdf为图像,因为我的 UNet 模型只接受图像。我已将数据集分别按 80/20 分为训练集和测试集。接下来,我编写了一个 python 脚本mask.py来屏蔽图像。参见下图。 

图3:右侧是科学论文的原始首页,左侧是相应论文的mask.py结果。 

蒙版图像是一维图像,其中每个像素的值为 0(黑色)和 1(白色)。 0表示该像素不重要,1表示该像素重要。左侧图像的白色区域掩盖了重要的标题、摘要和作者部分。

我们将此掩模和原始图像传递给我们的 UNet 模型进行训练。 UNet 是一种流行的架构。您可以找到该架构的许多实现。我推荐Milesial的架构。如果您已经克隆了dagshub存储库,则无需克隆此存储库。您可以通过将工作目录更改为Unet-OCR/Pytorch-UNet然后运行来构建模型,train.py如下所示:

python train.py --epoch 6 --batch-size 1 --learning-rate 0.000001

显然您可以设置自己的参数。当然您也可以使用预训练模型MODEL.pth,您将在运行时获得:

dvc pull -r origin

确保按照下面的安装说明将 DVC 源设置为我的

http://www.hotlads.com/news/3162.html

相关文章:

  • 追设计网站seo视频教程汇总
  • 做网站的html框架手机建立一个免费网站
  • 网站建设安全制度图片今天热搜前十名
  • 郑州高端做网站武汉大学人民医院
  • 云主机怎么做网站免费的黄冈网站有哪些
  • 帝国怎么做网站百度扫一扫网页版
  • 西宁市网站设计企业如何在百度搜索排名靠前
  • 信息技术 网站建设教案推广平台网站热狗网
  • 怎样在凡科免费做网站百度seo排名优化如何
  • 网站开发项目实训总结全网整合营销平台
  • seo快速排名培训厦门百度快照优化排名
  • 做网店哪个网站好公司域名查询官网
  • 网站地图+wordpress做网络推广可以通过哪些渠道推广
  • 做任务赚佣金网站有哪些小红书推广怎么做
  • 凡科登录网站手机版搜索排名影响因素
  • wordpress连接服务器配置福州百度快速优化排名
  • 微网站的定义艾瑞指数
  • wordpress博客站点地图关键词优化排名用哪个软件比较好
  • 找人做网站一套多少钱网站推广线上推广
  • 包装设计模板设计素材百度推广优化是什么意思
  • 百元便宜建站推广引流平台
  • 网站如何做seoseo站长助手
  • 营销型网站建设专家比较有名的个人网站
  • 北京企业网站案例seo查询
  • vba可做网站吗站长之家域名解析
  • 浦东手机网站建设竞价交易
  • 品牌网站建设报价免费国外ddos网站
  • 儋州网站建设卖友情链接的哪来那么多网站
  • 家居类企业响应式网站嘉兴优化公司
  • 天津网站建设报价怎样进行seo推广