当前位置: 首页 > news >正文

怎么让别人访问自己做的网站长沙专业seo优化公司

怎么让别人访问自己做的网站,长沙专业seo优化公司,网站建设宁夏凤凰云,长沙做网站品牌下面是一个完整的示例,其中包括了merge_tables_to_excel函数的定义,并且假设该函数的功能是从每个PDF文件中提取第一个表格并将其合并到一个Excel文件中: import os from pathlib import Path import pandas as pd import pdfplumber …

下面是一个完整的示例,其中包括了merge_tables_to_excel函数的定义,并且假设该函数的功能是从每个PDF文件中提取第一个表格并将其合并到一个Excel文件中:

import os  
from pathlib import Path  
import pandas as pd  
import pdfplumber  def extract_first_table_from_pdf(pdf_path):  try:  with pdfplumber.open(pdf_path) as pdf:  for page in pdf.pages:  tables = page.extract_tables()  if tables:  # tables[0]   pdf中的第一个表格,如果pdf有第二个表格你可以修改为tables[1] 根据你需求来调整return tables[0]   except Exception as e:  print(f"Error reading {pdf_path}: {e}")  return None  def merge_tables_to_excel(pdf_files, excel_path):  all_tables = []  for pdf_path in pdf_files:  first_table = extract_first_table_from_pdf(pdf_path)  if first_table:  df_table = pd.DataFrame(first_table[1:], columns=first_table[0])  all_tables.append(df_table)  if all_tables:  merged_tables_df = pd.concat(all_tables, ignore_index=True)  merged_tables_df.to_excel(excel_path, sheet_name='Merged Tables', index=False)  print(f"Tables have been saved to {excel_path}")  else:  print("No tables found in the PDF files.")  def find_all_pdf_files(directory):  return list(Path(directory).glob("*.pdf"))  if __name__ == "__main__":  # 指定PDF文件夹路径  pdf_folder = Path("refer")  # 获取文件夹中所有的PDF文件  pdf_files = find_all_pdf_files(pdf_folder)  # 打印找到的PDF文件列表  print("Found PDF files:", [str(file) for file in pdf_files])  # 指定要保存的Excel文件路径  excel_path = "merged_tables.xlsx"  # 提取并合并表格数据到Excel文件  merge_tables_to_excel(pdf_files, excel_path)

运行结果如图所示:
在这里插入图片描述
在这里插入图片描述

如果你想要遍历一个文件夹中的所有子文件夹,并获取每个子文件夹中的PDF文件,你可以使用递归函数来实现这个功能。下面是一个修改后的代码示例,它会递归地搜索指定目录及其所有子目录中的PDF文件:

import os  
from pathlib import Path  def find_all_pdf_files(directory):  pdf_files = []  for root, dirs, files in os.walk(directory):  for file in files:  if file.lower().endswith('.pdf'):  pdf_files.append(Path(root) / file)  return pdf_files  if __name__ == "__main__":  # 指定PDF文件夹路径  pdf_folder = Path("refer")  # 获取文件夹中所有的PDF文件,包括子文件夹中的PDF文件  pdf_files = find_all_pdf_files(pdf_folder)  # 打印找到的PDF文件列表  print("Found PDF files:", [str(file) for file in pdf_files])  # 指定要保存的Excel文件路径  excel_path = "merged_tables.xlsx"  # 提取并合并表格数据到Excel文件  merge_tables_to_excel(pdf_files, excel_path)

在这个示例中,find_all_pdf_files 函数使用 os.walk() 来递归遍历目录和子目录。os.walk() 会为每个目录返回一个三元组,包含当前目录的路径、当前目录下的子目录名列表,以及当前目录下的文件名列表。函数遍历每个文件名,检查它是否以 .pdf 结尾(不区分大小写),如果是,则将其添加到 pdf_files 列表中。

请确保你的 merge_tables_to_excel 函数能够处理多个PDF文件中的表格合并到Excel文件的逻辑。如果你需要更具体的帮助来定义这个函数,请提供更多关于你希望如何合并表格的信息。

http://www.hotlads.com/news/1486.html

相关文章:

  • 怎么恢复网站数据库文件位置合肥品牌seo
  • 好医生网站怎么做不了题目了辅导班培训机构
  • 做旅游网站怎么样怎么在百度上推广
  • 物流专线网站建设贵州seo学校
  • 网站正在建设中 页面销售网站
  • 怎么关闭自己公司网站高端网站建设报价
  • 网站留言怎么做自媒体培训学校
  • 网站建设com网站软文世界
  • 视频网站用户增长怎么做磁力猫引擎入口
  • 2023杭州疫情最新消息今天天津搜狗seo推广
  • 上海兼职做网站百家号优化
  • 维度 网站建设b2b平台营销
  • 做网站做得好的公司有网站优化的关键词
  • 兼职做猎头的网站环球网最新消息
  • 网线水晶头接法顺序排名优化
  • 营销型企业网站建设教案北京网站优化常识
  • 模板网站的劣势新闻稿
  • 关于网页设计的教育网站设计关键词排名优化顾问
  • 分公司注册流程及需要的材料seo优化 搜 盈seo公司
  • 做网站需要哪些工具seo网站推广价格
  • 大连做网站的企业吉安seo网站快速排名
  • 做网站 创业 流程足球进球排行榜
  • 自己做的视频可以同时上传到几家网站手机网站怎么优化
  • 网站开发流程 百度文库全国新冠疫情最新消息
  • 录像网站怎么做如何自己搭建一个网站
  • 自己服务器可以做网站深圳市住房和建设局官网
  • 农产品宣传推广方案学seo优化
  • 如何用源码做网站seo是什么平台
  • 石家庄h5网站建设公司网站如何推广
  • 网站建设合同图片合肥seo按天收费