绽放于二次元领域的翻译神器——SakuraLLM,带你探索ACGN文化的无界沟通

【免费下载链接】Sakura-13B-Galgame 适配轻小说/Galgame的日中翻译大模型 【免费下载链接】Sakura-13B-Galgame 项目地址: https://gitcode.com/gh_mirrors/sa/Sakura-13B-Galgame

随着全球ACGN(动画、漫画、游戏、轻小说)文化的发展,语言障碍成为了一个亟待解决的问题。而今天,我们有幸向您隆重推荐一款专为这一领域打造的开源翻译神器——SakuraLLM。这款独特的模型结合了最新的自然语言处理技术,能够精准地进行日中之间的轻小说和Galgame翻译,帮助爱好者们打破语言壁垒,沉浸在这美妙的世界之中。

项目介绍

SakuraLLM是一个基于一系列开源大模型构建的翻译模型,在通用日文语料与轻小说/Galgame等领域的中日语料上进行继续预训练与微调,旨在提供开源可控可离线自部署的、ACGN风格的日中翻译模型。

项目图标

项目技术分析

SakuraLLM充分利用了如SFT(Sequential Fine-Tuning)和RLHF(Reinforcement Learning from Human Feedback)等先进方法,借鉴了Qwen模型系列的知识,尤其是最新版本Qwen2.5的成果。通过持续的预训练和专门针对轻小说和Galgame领域的微调,SakuraLLM对这类文体的理解和翻译能力得到了显著提升,特别是在人称代词的准确使用、上下文关联以及特殊符号保留等方面。

应用场景

无论你是热衷于阅读日系轻小说的书迷,还是喜欢玩Galgame的游戏达人,SakuraLLM都能为你带来极大的便利。它可以应用于:

  1. 自动翻译日语轻小说,让你无需等待专业翻译就能第一时间了解故事进展
  2. 实时翻译Galgame对话,让玩家能无障碍体验全语音的日系游戏
  3. 提供翻译模板,助力ACGN相关的内容创作者快速产出中文版作品

项目特点

  1. 开源可控:SakuraLLM遵循CC BY-NC-SA 4.0协议,确保透明度和自由度
  2. 高效兼容:适应各种使用场景,无论是在线API服务还是离线部署
  3. 专属性强:针对ACGN领域定制,准确理解并翻译特定领域文本
  4. 持续进化:不断更新升级,为用户提供最佳的翻译效果

快速开始

模型下载

SakuraLLM提供了多个版本的模型供用户选择:

  • Sakura-14B-Qwen2.5-v1.0:14B参数模型,2024年10月8日发布
  • Sakura-7B-Qwen2.5-v1.0:7B参数模型,2024年11月23日发布
  • Sakura-1.5B-Qwen2.5-v1.0:1.5B参数模型,2024年10月12日发布

部署使用

项目提供了详细的部署教程和使用说明,支持多种推理后端:

  • llama.cpp:支持CPU和GPU推理
  • vllm:高性能推理框架
  • transformer:基于HuggingFace的推理

详细的API使用示例可以参考server.py和测试用例tests/example_openai.py

已接入的工具生态

SakuraLLM已经与多个ACGN翻译工具深度集成:

  1. LunaTranslator:Galgame实时翻译工具,支持剪贴板、OCR、HOOK等多种翻译方式
  2. GalTransl:Galgame离线翻译工具,用于制作内嵌式翻译补丁
  3. AiNiee:基于mtool或Translator++的RPG游戏自动批量翻译工具
  4. LinguaGacha:次世代文本翻译器,支持小说、游戏、字幕等文本内容的一键翻译

技术细节

SakuraLLM使用特定的prompt格式进行推理,支持术语表功能以保持专有名词和人称的一致性。模型在推理时推荐使用以下参数:

  • temperature: 0.1
  • top p: 0.3
  • do sample: True
  • max new token: 512

对于需要保持翻译一致性的场景,模型支持GPT字典功能,可以通过convert_to_gpt_dict.py工具进行字典格式转换。

版权声明

SakuraLLM所有模型均采用CC BY-NC-SA 4.0协议,禁止任何形式的商用。模型仅供学习交流使用,开发者对使用Sakura模型造成的问题不负任何责任。

此刻,让我们一起拥抱SakuraLLM,跨越语言的界限,畅游在日本轻小说和Galgame的梦幻世界里吧!

【免费下载链接】Sakura-13B-Galgame 适配轻小说/Galgame的日中翻译大模型 【免费下载链接】Sakura-13B-Galgame 项目地址: https://gitcode.com/gh_mirrors/sa/Sakura-13B-Galgame

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐