今天给大家带来字节跳动人工智能实验室王晓晖先生所做的分享《LightSeq:高性能NLP序列推理实践.pdf》。本次分享主要包含如下三大部分:
1、CUDA;
2、压缩量化;
3、TVM。
省时查报告 专业、及时、全面的行研报告库 | 长按并识别关注 |
【实践】LightSeq:高性能NLP序列推理实践-字节跳动.pdf(附下载链接)
阅读 121
2022-11-16
今天给大家带来字节跳动人工智能实验室王晓晖先生所做的分享《LightSeq:高性能NLP序列推理实践.pdf》。本次分享主要包含如下三大部分:
1、CUDA;
2、压缩量化;
3、TVM。
省时查报告 专业、及时、全面的行研报告库 | 长按并识别关注 |
相关推荐
精彩评论(0)