zai-org
/

cogvlm2-llama3-caption

Video-Text-to-Text

text-generation

Model card Files Files and versions

ShiyuHuang commited on Sep 19, 2024

Commit

b423daf

·

verified ·

1 Parent(s): d8db667

Update README_zh.md

Files changed (1) hide show

README_zh.md +10 -3

README_zh.md CHANGED Viewed

@@ -6,16 +6,25 @@
 <img src=https://raw.githubusercontent.com/THUDM/CogVLM2/cf9cb3c60a871e0c8e5bde7feaf642e3021153e6/resources/logo.svg>
 </div>
 通常情况下，大部分视频数据并没有附带相应的描述性文本，因此有必要将视频数据转换成文本描述，以提供文本到视频模型所需的必要训练数据。
 ## 使用方式
 ```python
 import io
 import numpy as np
 import torch
 from decord import cpu, VideoReader, bridge
 from transformers import AutoModelForCausalLM, AutoTokenizer
-import argparse
 MODEL_PATH = "THUDM/cogvlm2-llama3-caption"
@@ -63,7 +72,6 @@ def load_video(video_data, strategy='chat'):
 tokenizer = AutoTokenizer.from_pretrained(
     MODEL_PATH,
     trust_remote_code=True,
-    # padding_side="left"
 )
 model = AutoModelForCausalLM.from_pretrained(
@@ -118,7 +126,6 @@ def test():
 if __name__ == '__main__':
     test()
 ```
 ## 模型协议

 <img src=https://raw.githubusercontent.com/THUDM/CogVLM2/cf9cb3c60a871e0c8e5bde7feaf642e3021153e6/resources/logo.svg>
 </div>
+[代码](https://github.com/THUDM/CogVideo/tree/main/tools/caption) | 🤗 [Hugging Face](https://huggingface.co/THUDM/cogvlm2-llama3-caption) | 🤖 [ModelScope](https://modelscope.cn/models/ZhipuAI/cogvlm2-llama3-caption/)
 通常情况下，大部分视频数据并没有附带相应的描述性文本，因此有必要将视频数据转换成文本描述，以提供文本到视频模型所需的必要训练数据。
+CogVLM2-Caption是用于生成CogVideoX模型训练数据的视频caption模型。
+<div align="center">
+    <img width="600px" height="auto" src="./CogVLM2-Caption-example.png">
+</div>
 ## 使用方式
 ```python
 import io
+import argparse
 import numpy as np
 import torch
 from decord import cpu, VideoReader, bridge
 from transformers import AutoModelForCausalLM, AutoTokenizer
 MODEL_PATH = "THUDM/cogvlm2-llama3-caption"
 tokenizer = AutoTokenizer.from_pretrained(
     MODEL_PATH,
     trust_remote_code=True,
 )
 model = AutoModelForCausalLM.from_pretrained(
 if __name__ == '__main__':
     test()
 ```
 ## 模型协议