基于 AI 的浏览器自动化工具:一次录制,永久重用 | 开源日报 No.626
本文介绍了多个开源技术项目。workflow-use(3.0k星)是自动化工作流工具,支持浏览器交互录制与回放。typescript-go(20.0k星)将TypeScript移植到Go/Rust环境。airunner(1.1k星)是离线AI引擎,支持艺术创作、语音对话等。Flux(956星)是GPU通信库,优化并行计算。tpkutils(120星)是Python库,用于处理ArcGIS瓦片包数据
browser-use/workflow-usehttps://github.com/browser-use/workflow-use
Stars: 3.0k License: AGPL-3.0

workflow-use 是一个用于创建和运行确定性工作流的工具,旨在简化自动化流程。
-
一次录制,永久重用:只需录制浏览器交互一次,即可无限次回放。
-
⏳ 显示而非提示:无需花费大量时间反复提示浏览器执行相同操作。
-
️ 结构化且可执行的工作流:将录制转换为快速、可靠的确定性工作流,并自动提取表单中的变量。
-
🪄 类人互动理解:智能过滤噪声,从录制中创建有意义的工作流。
-
企业级基础设施:为未来扩展而构建,具备自愈和工作流差异等功能。
microsoft/typescript-gohttps://github.com/microsoft/typescript-go
Stars: 20.0k License: Apache-2.0

typescript-go 是 TypeScript 的原生移植开发的暂存库。
-
提供与 TypeScript 7 相同的程序创建和类型解析功能
-
支持相同的语法错误报告,确保一致性
-
包含命令行工具 tsgo,可用于替代 tsc
-
兼容 VS Code 扩展,便于调试和运行代码
-
使用 Go 和 Rust 构建,具备现代编程语言特性
Capsize-Games/airunnerhttps://github.com/Capsize-Games/airunner
Stars: 1.1k License: Apache-2.0

airunner 是一个离线推理引擎,专为艺术创作、实时语音对话、基于大型语言模型的聊天机器人和自动化工作流程而设计。
-
支持实时语音对话的聊天机器人,提供多种文本转语音引擎
-
可定制的代理角色,包括名称、情绪和个性,使对话更具吸引力
-
通过检索增强生成(RAG)技术丰富文档和网站的数据响应
-
使用稳定扩散(Stable Diffusion)进行文本到图像生成
-
提供图像处理功能,如修补与外延,以及控制网络与图像滤镜
-
完全离线运行,无需外部 API,提高安全性与性能
bytedance/fluxhttps://github.com/bytedance/flux
Stars: 956 License: Apache-2.0
Flux 是一个用于在 GPU 上进行张量/专家并行的快速通信重叠库。
-
提供高性能和可插拔的内核,支持模型训练和推理中的各种并行性。
-
与 Pytorch 兼容,易于集成到现有框架中。
-
支持多种 Nvidia GPU 架构和数据类型。
-
具备 NVSHMEM 支持,以优化 MoE 内核性能。
consbio/tpkutilshttps://github.com/consbio/tpkutils
Stars: 120 License: NOASSERTION
tpkutils 是一个用于读取和导出 ArcGIS 瓦片包的 Python 3 库。
-
提供对 ArcGIS 瓦片包中瓦片的便捷访问
-
支持将瓦片导出为 mbtiles 格式,方便在多种 mbtiles 服务器上托管
-
能够迭代读取单个瓦片并保存到磁盘
-
支持根据不同缩放级别选择性地读取和导出瓦片
-
提取并管理与瓦片包相关的元数据
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)