IEEE/ACM Transactions on Audio, Speech, and Language Processing投稿模板及期刊介绍

AJE基于期刊官网的投稿指南,为音频及语言处理领域的学者提供实用指导,助力打造符合期刊标准的学术文章。

更新于2025年5月23日

IEEE/ACM Transactions on Audio, Speech, and Language Processing投稿模板及期刊介绍

IEEE/ACM Transactions on Audio, Speech, and Language Processing(简称《TASLP》)是音频、语音及语言处理领域的旗舰期刊,致力于发表跨学科的原创研究,涵盖信号处理、人工智能及人机交互的理论与应用,为全球研究者及工程师提供权威平台。投稿需展现研究的创新性、技术深度及应用价值,并严格遵循IEEE格式规范。

IEEE推荐AJE的论文润色等服务,您在向IEEE旗下期刊提交稿件时,可以将AJE的润色证明一并提交给期刊。

AJE基于期刊官网的投稿指南,为音频及语言处理领域的学者提供实用指导,助力打造符合期刊标准的学术文章。

IEEE/ACM Transactions on Audio, Speech, and Language Processing官网截图

期刊主页https://ieeexplore.ieee.org/xpl/RecentIssue.jsp?punumber=6570655

期刊简介

《TASLP》由IEEE Signal Processing Society、ACM及IEEE Computer Society联合主办,创刊于2014年(前身为《IEEE Transactions on Audio, Speech, and Language Processing》,2006-2013年),专注于音频、语音及语言处理的理论、算法及应用。期刊涵盖语音识别、语音合成、音频信号处理、自然语言处理、对话系统、声学建模及多模态信号处理等。文章需具创新性、科学严谨性或跨学科应用价值,适合信号处理、AI及语言技术领域的专业人士。期刊采用严格的同行评审,初审平均8-12周(官网数据)。作为混合出版期刊,作者可选择传统订阅模式或开放获取(OA)。

期刊相关信息

  • 影响因子:4.1(2023年)
  • 中科院分区:2区(计算机科学-工程:电子与电气)1区(声学)
  • 出版费用:开放获取费用(APC)为2,345美元(2025年IEEE标准,官网数据);订阅模式无APC。
  • 出版频率:月刊(每年12期)。

投稿注意事项

  • 文章长度:建议8-12页(双栏),含图表和参考文献;超出12页需支付超页费(220美元/页)。
  • 投稿信:需提交,说明研究的创新性、技术贡献及适合《TASLP》的理由,需突出音频/语言处理的跨学科价值。
  • 初始投稿格式:需使用IEEE双栏模板(Word或LaTeX),初稿提交PDF,图表嵌入正文。
  • 数据可用性:强烈建议公开数据,存放在IEEE DataPort或公共存储库(如figshare)并提供DOI。
  • 代码可用性:需提供算法或实验代码(如GitHub链接)或补充材料。
  • 预印本政策:接受在arXiv等预印本服务器发布的稿件,需在投稿时声明。
  • 审稿周期:初审约8-12周,采用单盲评审,至少三位审稿人。
  • 出版费用减免:开放获取文章的无资助研究可申请APC减免,投稿后联系IEEE出版办公室(openaccess@ieee.org)。
  • 开放获取选项:作者可选择开放获取(需支付APC)或订阅模式(无APC)。
  • 彩图费用:订阅模式下,彩图每页175美元;开放获取文章无彩图费用。
  • 投稿限制:允许一轮主要修订和一轮次要修订,拒绝后需编辑许可方可重新提交。
  • 语言润色:建议使用IEEE推荐的AJE(American Journal Experts)服务,润色证明可随稿件提交。
  • 扩展论文:如基于会议论文扩展,需新增至少30%内容,并提交原会议论文供审查。

文章类型

《TASLP》主要发表以下类型文章:

  • Regular Paper:完整研究文章(8-12页),报告音频、语音或语言处理的原创研究。
  • Short Paper:简短研究报告(≤6页),聚焦新颖发现或初步结果。
  • Survey Paper:综述音频/语言处理某一专题(8-12页),需具广泛参考价值,通常由编辑邀请。
  • Comment:对已发表文章的评论或更正(≤2页),需编辑批准。
  • Correction:更正已发表文章,需编辑批准。

投稿需通过Manuscript Central提交,Survey Paper需先联系编辑(taslp-eic@ieee.org)。

文章结构

一篇典型的Regular Paper包括以下部分,每部分附简短英文示例:

  • 标题:简洁、描述性,突出音频/语言主题,最大15字。
    示例
    Deep Speech Recognition Model
  • 作者信息:列出所有作者的姓名、单位、电子邮件及ORCID。
    示例
    Department of Computer Science, University of Toronto, Toronto, ON, Canada
    Li Wei, Sarah Patel
    Speech Lab, University College London, London, UK
    Emma Brown
  • 贡献声明:明确每位共同作者的贡献,遵循IEEE标准。
    示例
    L.W. developed the model; S.P. conducted experiments; E.B. wrote the manuscript.
  • 通信作者:指定通信作者,提供电子邮件及ORCID。
    示例
    Correspondence to: Emma Brown (emma.brown@ucl.ac.uk)
  • 摘要:概述研究背景、方法、结果和意义,最大250字,无参考文献。
    示例
    A deep learning model for speech recognition achieves 5% WER on noisy data. Experiments on 10,000 utterances show 20% improvement over baselines. Code is available at GitHub (https://github.com/SpeechModel). This model enhances real-time transcription.
  • 关键词:提供3-8个关键词,便于检索。
    示例
    speech recognition, deep learning, noise robustness, audio processing
  • 引言:介绍研究背景、问题及目标,需包含参考文献。
    示例
    Speech recognition struggles in noisy environments [1]. Deep learning offers robust solutions [2]. This paper proposes a noise-robust neural model.
  • 正文:分节描述方法、实验、结果和讨论,使用子标题。
    示例
    Model Architecture
    The proposed CNN-RNN model reduces WER by 20% in 30 dB noise (figure 1) [3].
  • 结论:总结关键发现,提出应用或未来方向。
    示例
    Conclusion
    The model improves speech recognition in noise. Future work will address multilingual data.
  • 参考文献:列出所有引用文献(详见第6节)。
    示例
    [1] G. Hinton et al., “Deep neural networks for acoustic modeling,” IEEE Trans. Audio, Speech, Lang. Process., vol. 20, no. 4, pp. 123-134, Apr. 2012.
  • 致谢(可选):感谢资助机构或个人,包含资助编号。
    示例
    Funded by NSERC grant SP-1234567. We thank the Toronto Speech Lab.
  • 作者简介:简述作者背景、教育经历及研究兴趣,附照片(可选)。
    示例
    Li Wei received the Ph.D. degree from University of Toronto in 2022. Her research focuses on speech recognition.
  • 伦理声明:包括利益冲突声明。
    示例
    Competing interests: The authors declare no competing interests.
  • 数据可用性(如适用):提供数据存储库名称和访问编号。
    示例
    Data available at IEEE DataPort: https://doi.org/10.21227/abc123
  • 补充材料(可选):提供额外数据、代码或音频。
    示例
    Supplementary Audio S1: Speech recognition demo.
    Supplementary Data S1: Experimental datasets.

格式要求

《TASLP》要求初稿使用IEEE双栏模板(Word or LaTeX),建议8-12页,修订稿需符合出版规范。以下是具体要求:

字体和字号

  • 正文:Times New Roman,10号字,单倍行距。
  • 一级标题:粗体,11号字,首字母大写
  • 二级标题:粗体,10号字,首字母大写
  • 图表标题:粗体,8号字

页面布局

  • 使用 A4或Letter纸张,双栏排版。
  • 页边距:上2.5厘米,下1.9厘米,左右1.6厘米
  • 行距:单倍行距,段前段后0点间距。

图表格式

  • 图表嵌入正文,初稿为PDF,修订稿需单独上传高分辨率文件。
  • 图表标题置于下方,Times New Roman,8号字,居中
  • 图表文字:8号字,确保清晰。
  • 图表分辨率:至少600 DPI,推荐格式为TIFF、EPS或高分辨率JPEG
  • 颜色选择:支持彩色,建议高对比度(如蓝/黄),避免红绿。
  • 图例:每幅图说明不超过300字,置于图下方。
  • 版权:需获得受版权保护的图表许可,提交许可文件。
  • 示例:
    Figure 1: Model performance.
    a WER vs. noise level (blue: proposed; red: baseline). b Latency analysis.

公式与术语

  • 公式居中,右对齐编号,如 (1),文中称为“equation (1)”.
  • 术语遵循IEEE标准(如“word error rate”而非 “WER”)。
  • 示例:
    (1) L = -Σlog(p(y|x))

表格

  • 表格嵌入正文,包含标题和图例,置于页面顶部或底部。
  • 大型表格作为补充材料(如Excel)。

参考文献格式

《TASLP》要求使用IEEE引用风格,按文中出现顺序编号,文中以方括号引用(如 [1])。参考文献需准确,优先引用期刊文章。以下是示例:

  • 期刊文章
    [1] G. Hinton, L. Deng, and D. Yu, “Deep neural networks for acoustic modeling,” IEEE Trans. Audio, Speech, Lang. Process., vol. 20, no. 4, pp. 123-134, Apr. 2012.
  • 会议论文
    [2] L. Wei and S. Patel, “Noise-robust speech model,” in Proc. IEEE Int. Conf. Acoust., Speech, Signal Process., Kyoto, Japan, Mar. 2022, pp. 45-46.
  • 书籍
    [3] J. Benesty, M. M. Sondhi, and Y. Huang, Springer Handbook of Speech Processing. Berlin, Germany: Springer, 2008.
  • 数据集
    [4] L. Wei and E. Brown, “Speech dataset,” IEEE DataPort, 2023. [Online]. Available: https://doi.org/10.21227/abc123
  • 预印本
    [5] S. Patel and E. Brown, “Speech recognition model,” arXiv:2301.12345, Jan. 2023. [Online]. Available: https://arxiv.org/abs/2301.12345

伦理声明

  • 利益冲突:需声明所有作者的利益冲突(如“无利益冲突”)。
  • 伦理合规:如涉及人体数据,需提供伦理委员会批准编号。
  • 数据可用性:需声明数据存储库及访问方式(如适用)。
  • 代码可用性:需提供代码存储库或补充材料。
  • 示例:
    Competing interests: The authors declare no competing interests.
    Data availability: Data at IEEE DataPort: https://doi.org/10.21227/abc123.
    Code availability: Code at GitHub: https://github.com/SpeechModel.

补充材料

  • 补充材料作为单独文件提交,格式为PDF、Excel、MP4(H.264编码,16:9)或ZIP
  • 包含大型数据集、代码或音频,无额外费用。
  • 示例:
    Supplementary Audio S1: Speech recognition demo.
    Supplementary Data S1: Experimental datasets.

投稿流程

作者需通过Manuscript Central提交论文。流程如下:

  • 注册并关联ORCID,指定通信作者(需符合IEEE作者标准)。
  • 上传IEEE模板稿件(PDF)、投稿信、图表(嵌入PDF)及补充材料。
  • 提供利益冲突声明数据/代码可用性声明
  • 提交推荐审稿人(可选,3-5人,需提供姓名、邮箱及理由)。
  • 在Manuscript Central跟踪审稿状态,初审约8-12周。
  • 修订稿需提交:修改稿(Word/LaTeX)、审稿回复(逐点回应)、高分辨率图表。
  • 可联系编辑部(taslp-eic@ieee.org)查询状态或申请APC减免(开放获取文章)。

最后

IEEE/ACM Transactions on Audio, Speech, and Language Processing作为音频与语言处理领域的热门期刊,以其跨学科视野和高质量研究成果引领信号处理与AI的融合。当前投稿请使用IEEE模板,并通过Manuscript Central提交,期待您的成果在全球音频与语言社区中大放异彩!建议投稿前仔细核对官网投稿指南及IEEE模板.

撰稿人
标签
IEEE
目录
订阅邮件
订阅我们的邮箱后可提前获得AJE作者资源的文章,享受AJE服务的折扣,以及更多的优惠

查看 "隐私协议"

IEEE系列期刊推荐使用AJE的论文润色服务

我们很荣幸能与IEEE保持长期的合作,为全球科研作者提供高质量的论文语言润色等服务,我们已经帮助众多投稿IEEE期刊的作者解决了稿件的语言问题,大幅提高论文被接收的概率。