1001 家 LinkedIn 公司示例数据集

一个包含 1000 多家公司的 GitHub 示例数据集。该数据集使用 Bright Data API 提取。

此免费数据集包含的数据点:

  • id:公司的唯一标识符
  • name:公司名称
  • country_code:公司所在国家/地区代码
  • locations:公司所在地
  • followers:公司在 LinkedIn 上的关注者数量
  • employees_in_linkedin:在 LinkedIn 上列出的员工数量
  • about:公司简介
  • specialties:公司专长
  • company_size:公司规模(员工人数)
  • organization_type:组织类型
  • industries:公司所在行业
  • website:公司官网 URL

以及更多数据点。

这是从“LinkedIn 公司信息(公开数据)”数据集中提取的样本子集,该数据集包含超过 56,000,000 家公司

可用的数据集文件格式:JSON、NDJSON、JSON Lines、CSV 或 Parquet。可选支持 .gz 压缩

数据集交付方式:邮件、API 下载、Webhook、Amazon S3、Google Cloud Storage、Google Cloud Pub/Sub、Microsoft Azure、Snowflake、SFTP

更新频率:一次性、每日、每周、每月、每季度,或自定义

可按需提供数据强化(在已提取数据点基础上追加):根据需求提供

获取完整的 LinkedIn 数据集

可用的 LinkedIn 数据集:

LinkedIn 数据集的使用场景有哪些?

1. 竞争分析

利用企业画像数据监测公司增长,定位关键组织与从业者,追踪员工流动,更高效地加强竞争情报与分析。

2. 市场趋势与增长

评估公司增长与行业趋势,支持数据驱动决策。对对冲基金、VC 和金融机构而言,LinkedIn 数据集可显著提升投资分析能力。

3. B2B 公司数据

将高质量的公司与员工数据集成到您的 CRM 中,并结合全面的 LinkedIn 数据集,以提升获客与销售情报。

为学术研究者与公益组织提供免费的爬虫工具与数据集访问

Bright Initiative 向领先学术院系与研究人员、以及推动各类环保与社会公益事业的 NGO 与 NPO 提供对 Bright Data 的 网页抓取工具 API 与 即用型数据集 的访问。您可以在此处提交申请。

想自己抓取 LinkedIn 吗?使用我们的 LinkedIn 抓取工具

可用的 LinkedIn 抓取器


  扫码关注“亮数据”官微,第一时间获取产品技术,促销及行业动态分享等信息!如有任何问题,还可以官微留言。

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐