理解和运行大模型的本地离线训练、运行流程

Posted on 2023年12月9日 | By chinaoss

1 大模型在本地离线运行的流程通常包括以下几个步骤：
2 如何使用训练好的模型得到输出？

帮助初学者理解和运行大模型的本地离线训练、运行流程：

大模型在本地离线运行的流程通常包括以下几个步骤：

下载训练代码：首先，你需要下载相关的训练代码。通常，大模型的训练代码会在开源的代码库中进行维护，你可以通过GitHub等平台搜索到相应的代码。
准备环境：在运行代码之前，你需要确保你有相应的环境来支持模型的运行。这包括正确配置Python环境、安装相应的依赖库以及GPU驱动等。
下载模型数据文件：大模型通常需要预训练的权重文件作为输入。你可以通过官方的提供的链接或者其他渠道下载这些模型数据文件，并保存到本地。
修改配置：有些大模型的代码会提供一个配置文件，你需要根据自己的需求对配置文件进行修改。配置文件中包括了输入输出文件路径、超参数等设置，你可以根据实际情况进行修改。
运行代码：根据具体的代码说明，你需要运行相应的命令来启动模型的训练或推理过程。在运行之前，确保你已经正确设置好模型数据文件的路径和其他配置项。

综上所述，要在本地离线训练大模型，你需要下载训练代码、准备环境、下载模型数据文件、修改配置、运行代码。这个流程可能因模型的不同而有所差异，但基本思路是相通的。

如何使用训练好的模型得到输出？

下面是使用已训练好的模型进行推理的一般步骤：

加载模型：使用相应的深度学习框架（如TensorFlow、PyTorch等），加载已训练好的模型权重文件。通常可以通过指定模型的名称或文件路径来加载模型。
数据预处理：将输入数据进行预处理，使其与训练数据具有相同的格式和表示。这可能包括词向量化、标准化、缩放或其他必要的数据处理步骤。
推理过程：根据模型的类型和任务，使用加载的模型对输入数据进行推理。这涉及将输入数据传递给模型，并获取模型的输出结果。
后处理：根据任务的需求，对模型的输出进行后处理。例如，对于分类任务，可以应用一个阈值来确定最终的类别标签。
获取输出结果：根据需要，将模型的输出结果格式化为可读的文本、图像、数值等形式，并返回给用户或保存到文件中。

需要注意的是，每个具体模型和任务的实现方式可能有所不同，所以以上步骤需要根据具体的模型和任务进行调整。你可以查阅相关模型的文档或参考例子来了解更详细的使用方法。… 查看余下内容

python机器学习报错 libcufft.so.11: cannot open shared object file: No such file or directory 的问题复现和解决记录

Posted on 2023年12月8日 | By chinaoss

1 关键报错信息：
2 完整报错信息：
3 问题原因分析：
4 解决方式：

关键报错信息：

libcufft.so.11: cannot open shared object file: No such file or directory

或类似的动态库缺失的报错。

完整报错信息：

Traceback (most recent call last):
  File "/root/miniconda3/envs/mypy38/lib/python3.8/site-packages/torch-2.1.1-py3.8-linux-x86_64.egg/torch/__init__.py", line 174, in _load_global_deps
    ctypes.CDLL(lib_path, mode=ctypes.RTLD_GLOBAL)
  File "/root/miniconda3/envs/mypy38/lib/python3.8/ctypes/__init__.py", line 373, in __init__
    self._handle = _dlopen(self._name, mode)
OSError: libcufft.so.11: cannot open shared object file: No such file or directory

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "main.py", line 1, in 
    from simcse import SimCSE
  File "/root/SimCSE/simcse/__init__.py", line 1, in 
    from .tool import SimCSE
  File "/root/SimCSE/simcse/tool.py", line 5, in 
    import torch
  File "/root/miniconda3/envs/mypy38/lib/python3.8/site-packages/torch-2.1.1-py3.8-linux-x86_64.egg/torch/__init__.py", line 234, in 
    _load_global_deps()
  File "/root/miniconda3/envs/mypy38/lib/python3.8/site-packages/torch-2.1.1-py3.8-linux-x86_64.egg/torch/__init__.py",

… 查看余下内容

Centos9/rockylinux9启动提示LVM分区异常的解决办法：device file sys_wwid last seen on not found,timed out waiting for device

Posted on 2023年11月6日 | By chinaoss

1 问题表现形式
2 问题根源：
3 紧急解决方式：
4 彻底解决方式：
- 4.1 解决方式一：
- 4.2 解决方式二：

问题表现形式

Centos9/rockylinux9 系统使用再生龙（clonezilla）硬盘对拷后，得到的新硬盘的系统启动报错信息：

timed out waiting for device /dev/mapper/rl-home

LVM的逻辑分区有 rl-root，rl-home，rl-swap
其中只有提示 rl-home的问题。但rl-home和rl-root的分区格式都是xfs（换成ext4也一样的报错）。

报错截图：

问题根源：

在 RHEL 9.0 上，LVM 使用持久命名文件 /etc/lvm/devices/system.devices 来查找 PV，例如 IDTYPE、IDNAME、DEVNAME、PVID 等（此配置在 RHEL 9.0 上默认启用，在 RHEL 8.x 上默认禁用。在 AHV 上，克隆或创建快照功能会为 SCSI 磁盘生成新的 PV（在 ESXi 和 Hyper-V 上不会发生这种情况），但持久命名文件 /etc/lvm/devices/system.devices 不会在新虚拟机启动时自动更新。在此问题中，持久命名文件 /etc/lvm/devices/system.devices 中未列出新 PV，这会导致 LVM 忽略新 PV。在操作系统启动期间，原始 PV 中所需的磁盘分区不会挂载，而是 VM 进入紧急模式。

紧急解决方式：

若要从紧急模式恢复 VM，只需执行以下步骤：

删除原始设备文件：
root@VM# rm /etc/lvm/devices/system.devices
创建新的设备文件：
root@VM# vgimportdevices -a

彻底解决方式：

解决方式一：

编辑系统目录下的lvm的配置文件（/etc/lvm/lvm.conf 的 129行左右）

将其中的

#use_devicesfile=1

修改为

use_devicesfile=0

然后重启。问题解决。
解决方式一的一个可选后续操作为：

root@VM# rm /etc/lvm/devices/system.devices

解决方式二：

要防止虚拟机进入下一个克隆/快照的紧急模式，请执行以下操作：

在原始 VM 上，暂时禁用设备文件：
root@VM# mv /etc/lvm/devices/system.devices /tmp/
创建虚拟机克隆/快照。
在原始 VM 上，使用设备文件恢复：
root@VM# mv /tmp/system.devices

… 查看余下内容

Linux的层级架构与Rust的主要模块crate总结，值得转发收藏

Posted on 2023年10月25日 | By chinaoss

1 Linux的层级架构
2 Rust的标准库的功能划分

Linux的层级架构

每个操作系统都有一个内核，内核封装了底层硬件设备管理、内存管理、网络数据协议转化和收发传输、文件系统读写等。从这个图可以看到，内核将系统硬件与应用程序进程连接起来，隐藏了上层下层交互的一些细节，各司其职。

这些分层包括：

用户空间程序
编译器
终端
防火墙
系统调用的跨平台API(特定于平台的系统调用包装API)
Rust标准库
libc（或等效的API）
kernel，操作系统的核心模块
系统资源
内存
文件系统
网络
硬件和其他设备（包括键盘、鼠标、监视器、磁盘驱动器）

Rust的标准库的功能划分

而Rust标准库，很好的利用了操作系统内核提供的API。

Rust标准库是Rust程序进入Linux操作系统内核函数的主要接口，它在内部使用libc(在Windows系统使用其他等效的库）来调用内核提供的系统调用。

从Rust程序中发起系统调用，以实现管理和操作各种系统资源（如图）。libc（或其变体）为类UNIX操作系统上的系统调用提供了一个包装器，如Linux内核实现了POSIX标准指定的数百个POSIX API（对于Windows，系统调用有等效的API，也实现了POSIX标准）。

作为标准库，Rust标准库是跨平台的，Rust标准库的系统调用的细节是从Rust开发人员那里抽象出来的。Rust也支持不依赖于标准库的运行方式（no_std 方式），Rust直接操控底层硬件（如应用在嵌入式系统开发场景），此时Rust就做了操作系统本身的工作。

对于大部分软件开发工程师而言，他们用Rust主要开发应用层软件，也就是运行在用户空间的程序。它们基于标准库编写，实现各种业务功能。应用层的软件并非所有模块和函数都涉及到系统调用（例如一些用于操作字符串和处理错误的函数，就无需调用系统调用）。

Rust标准库包括几大领域的模块，包括四大类：

第一类，Rust语言原语

即Rust Language Primitives：Rust 语言的基本元素或基本类型（如下图）。

如有符号整数、布尔值、浮点数、字符、字符串、数组、元组、切片。这些由Rust编译器负责实现。

Rust标准包括原语，并在它们之上构建。

第二类，alloc crate

与堆分配值的内存分配相关的类型、函数和特征。

包括集合（Vec、String等集合）、智能指针类型（Box<T>）、引用计数指针（Rc<T>）和原子引用计数指针（Arc<T>））。

第三类，core crate

作为Rust标准库的基础。充当Rust语言与标准库之间的链接，提供在Rust原语之上实现的类型、特征、常量和函数，并为所有Rust代码提供基础构建块，它是跨平台的，没有任何指向操作系统或其他外部依赖的链接。由于较少直接用到core crate，所以本文不做过多介绍。

第四类，模块（标准库的其他crate）

是标准库的一部分，模块crate包括针对并发、I/O，文件系统、网络、异步I/O、错误处理等功能，以及与特定操作系统相关的函数，Rust的官网对std有专门的文档。例如

为用户程序在多个线程上并发运行的功能在std::thread模块中；
用于处理同步I/O的功能在std::io模块中提供；
针对特定os的模块，主要在std::os模块中实现。

下图展示了Rust标准库各个领域功能涉及到的具体std模块（如std::io、std::os等）

以下着重对第四类的主要 crate 做一介绍，并附上文档地址

Rust的并发控制相关模块 conurrency：

模块名	说明
std::env 模块	包含与环境变量交互的功能，包括读取、设置和删除环境变量。
std::sync 模块	提供了用于实现线程安全共享状态的同步原语，如互斥锁（Mutex）、原子操作（Atomic）和条件变量（Condvar）。
std::thread 模块	提供了创建和管理线程的功能，包括线程的创建、 join、spawn 和同步。
std::process 模块	提供了与操作系统进程交互的功能，包括运行外部命令、启动新进程以及与进程进行通信。

Rust的内存管理相关模块 memory management：

模块名	说明
std::alloc 模块	提供了内存分配器的功能，包括分配和释放动态内存。
std::convert 模块	提供了用于不同类型之间转换的工具函数。
std::ptr 模块	提供了对指针的操作和转换功能，包括对裸指针的操作。
std::borrow 模块	提供了用于管理借用的功能，包括`&`和`&mut`借用运算符的实现。
std::default 模块	提供了默认 trait 实现的功能，用于为不提供具体实现的类型提供默认行为。
std::rc 模块	提供了引用计数（Reference Counting）的功能，用于实现线程安全的共享内存。
std::cell 模块	提供了可变性的 Cell 和 RefCell 类型，用于在多线程环境下安全地共享可变状态。
std::mem 模块	提供了与内存相关的功能，包括内存布局、内存对齐和内存操作。
std::clone 模块	提供了用于实现克隆（Clone） trait 的功能，用于复制和克隆复杂的数据结构。
std::pin 模块	提供了 Pin 类型，用于固定借用的生命周期，以避免悬垂指针和数据竞争问题。

Rust的文件系统操作相关模块 File system：

模块名	说明
std::fs 模块	提供了与文件系统操作相关的功能，包括文件和目录的创建、读取、写入和删除等操作。
std::path 模块	提供了与文件路径相关的功能，包括路径的解析、构造和操作。

Rust的数据处理相关模块 data processing：

模块名	说明
std::ascii 模块	提供了与 ASCII 码相关的功能，包括对 ASCII 字符的操作和转换。
std::fmt 模块	提供了格式化输出的功能，包括对各种数据类型的格式化和打印。
std::num 模块	提供了对数字类型的抽象和操作，包括整数、浮点数和复数等。
std::cmp 模块	提供了用于比较和排序值的工具，包括比较运算符的实现和排序函数。
std::hash 模块	提供了用于计算哈希值的功能，包括对各种数据类型的哈希函数实现。
std::ops 模块	提供了一些基本的运算符和操作符的实现，包括数学运算符、比较运算符和逻辑运算符等。
std::iter 模块	提供了迭代器（Iterator）的功能，包括创建和操作迭代器的方法，以及一些常见的迭代器类型。

Rust的错误处理相关模块 Error handling：

模块名	说明
std::error 模块	提供了错误处理的功能，包括定义错误类型和处理错误的方法。
std::panic 模块	提供了恐慌（Panic）机制，用于处理不可恢复的错误情况。
std::option 模块	提供了 Option 类型，用于表示可能存在或不存在的值，用于处理可能出现空值的情况。
std::result 模块	提供了 Result 类型，用于表示成功或失败的情况，通常用于处理可能出现错误的函数返回值。

Rust的编译处理相关模块 compiler：

模块名	说明
std::hint 模块	提供了一些用于编译器提示的宏，用于影响编译器的优化行为。
std::primitive 模块	提供了一些基本的类型和函数，用于处理数字、字符和布尔值等基本数据类型。
std::prelude 模块	包含了一些基本的函数和宏，这些函数和宏在 Rust 标准库中被广泛使用，并且在每个 Rust 程序中自动导入。

Rust的跨语言调用相关模块： FFI

模块名	说明
std::ffi 模块	提供了与外部函数接口（Foreign Function Interface，FFI）相关的功能，用于与其他语言或库进行交互。

Rust的网络处理功能模块 Networking：

模块名	说明
std::net 模块	提供了与网络编程相关的功能，包括网络协议、套接字（Socket）和网络地址等。

Rust的IO处理模块：

模块名	说明
std::io 模块	提供了与输入输出相关的功能，包括文件操作、缓冲、读写数据等。

Rust的OS特定的功能模块：

模块名	说明
std::os 模块	提供了与操作系统相关的功能，包括文件系统操作、进程管理和系统信息等。

Rust的时间处理模块：

模块名	说明
std::time 模块	提供了与时间和日期相关的功能，包括时间的表示、解析、转换和计算等。

… 查看余下内容

干货总结Rust的应用范围将会爆发，全栈开发者如何看清2023的历史临界点及未来趋势

Posted on 2023年9月29日 | By chinaoss

Rust 诞生已经有 17 年了，最近我考察了将团队的开发技术栈从 Python 生态转到 Rust 生态的可行性。先说结论：99% 可行。

Rust 生态目前的规模

不是 100% 可行，因为 Python 生态的一些名库还未提供 Rust 版本，但请注意到，那些 Python 生态有的功能，Rust 生态里也大部分有了。毕竟 Rust 已经 17 岁了，经过 17 年的积累，Rust 终于快到 “成年” 了。比如 Rust 的线上 Crate 仓库 lib.rs 现有 127219 个包，Python 的 pypi.org 仓库现有 484174 个包（以上统计截至 2023 年 9 月 28 日）、而 Go 语言在 pkg.go.dev 上有超过 170000 个包（截至 2023 年 4 月）。

为什么我决定从 Python 转换到 Rust？如何通过Rust的强大生态工具，提高开发效率和软件质量？

在我的公号里总结分享了 Rust语言解决问题的能力、它能为使用者提高多少效率、最终创造多少价值。

目前（2023 年）正处在 Rust 大规模应用爆发的临界点。大量软件团队正在用 Rust/Go 重写软件。

下面从三个具有代表性的应用实例以及一些 Rust 语言大事件，向读者分享下这个 “Rust 临界点” 的观点。

详情网页链接… 查看余下内容

rust+Qt+PaddleOCR 实现的OCR桌面软件示例

Posted on 2023年9月18日 | By chinaoss

1 功能效果
2 src/ocr.rs 文件的来源：
3 注意：
4 如何编译：
- 4.1 编译测试版
- 4.2 编译生产版
5 授权协议
6 rust+Qt 的其他项目：
7 结论：

功能效果

基于paddleOCR 的图片文字识别（OCR）桌面软件，使用Rust+QT开发。

带调试界面的运行效果：

src/ocr.rs 文件的来源：

安装 ruic 工具，https://github.com/jnbooth/ruic
然后

cd src/
ruic.exe -o uic.rs --all mainwindow.ui

就会得到src/uic.rs 。目前已包含 src/uic.rs 文件，所以无需执行上述 ruic 命令。

注意：

ruic.exe 对 QT5 的Line 类不支持。需要将uic.rs中重复的声明和 Line 相关的声明删掉。
编译环境要求：qt 5.14.0或低于该版本的qt。windows 10系统。rust qt在windows下的环境要求在有 msvc 编译器的环境，
所以建议使用：打开【适用于 VS 2017 的 x64 本机工具命令提示】后cd到项目目录下进行cargo 操作。
在cargo build 之前，要确保按照【PaddleOCR-json\说明.txt】文件的要求放置好 PaddleOCR-json 的文件。
main.rs 中 pub type OcrResult = Vec<Root>; 等代码参考了 https://gitee.com/toobo/PaddleOCRRust/blob/master/src/entity.rs ，在此向toobo（ ZHao ）表示感谢！感谢 PaddleOCR-json 项目。

如何编译：

由于技术栈基于 Rust + Qt 5.14.0 + paddleOCR(C++)，所以需要借助一些rust crate库实现。编译过程已通过build.rs 脚本进行了一键封装。

编译测试版

cargo build

编译生产版

cargo build --release

授权协议

Apache-2.0

rust+Qt 的其他项目：

使用 Rust + Qt 开发的仿有道词典的翻译 + 词典工具.

… 查看余下内容

Linux 0.01代码分析：键盘输入字符串到屏幕显示的整个过程

Posted on 2023年9月11日 | By chinaoss

在Linux 0.01 版本中，键盘输入字符串到屏幕显示是通过以下步骤实现的：

键盘中断处理程序：当用户按下键盘上的键时，硬件会产生一个中断信号，通知操作系统有键盘输入发生。在 Linux 0.01 中，键盘中断处理程序位于 keyboard_interrupt 函数中，它是在 kernel/keyboard.s 文件中定义的。
中断处理程序的注册：在操作系统启动时，会设置一个中断向量表（interrupt vector table），将键盘中断与相应的处理程序关联起来。在 Linux 0.01 中，这个过程发生在 head.s 文件中的 setup_idt 函数中。
键盘中断处理程序的执行：当键盘中断发生时，CPU会跳转到键盘中断处理程序的入口地址，即 keyboard_interrupt 函数。在该函数中，将从键盘读取输入字符。
键盘输入的处理：键盘输入的处理过程包括读取键盘缓冲区中的字符，将其转换为可打印字符，并将其输出到屏幕上。在 keyboard_interrupt 函数中，使用 inb 汇编指令读取键盘缓冲区，并进行相应的处理。
字符串的显示：在 Linux 0.01 中，字符串的显示是通过调用 BIOS 中断实现的。在 keyboard_interrupt 函数中，使用 int 汇编指令调用 BIOS 中断，将字符显示在屏幕上。

linux0.01的键盘按下到显示到屏幕的流程图

下面是简化的示例代码，展示了 Linux 0.01 中键盘输入字符串到屏幕显示的实现：

# kernel/keyboard.s

# 键盘中断处理程序
keyboard_interrupt:
    pusha               # 保存寄存器状态

    inb $0x60, %al      # 从键盘缓冲区读取字符
    call process_input  # 处理输入字符

    popa                # 恢复寄存器状态
    iret                # 中断返回

# 处理输入字符
process_input:
    cmp $0x01, %al      # 检查是否是按下 Esc 键
    je quit             # 如果是，退出程序

    cmp $0x0E, %al      # 检查是否是按下 Backspace 键
    je backspace        # 如果是，执行退格操作

    cmp $0x0D, %al      # 检查是否是按下 Enter 键
    je newline          # 如果是，换行

    call print_char     # 输出字符到屏幕
    ret

# 输出字符到屏幕
print_char:
    pusha               # 保存寄存器状态

    mov $0x0E, %ah      # 设置显示属性（白底黑字）
    mov $0x0007, %bx    # 设置显示页为 0，光标位置为当前位置

    int $0x10           # 调用 BIOS 中断显示字符

    popa                # 恢复寄存器状态
    ret

# 退格操作
backspace:
    ; 实现退格操作的代码

    ret

# 换行
newline:
    ; 实现换行的代码

    ret

# 退出程序
quit:
    ; 实现退出程序的代码

    ret

请注意，这只是一个简化的示例代码，真实的 Linux 0.01 版本代码更加复杂，包含了更多的功能和细节。此外，这段代码是基于汇编语言编写的，而不是高级编程语言。… 查看余下内容

从本地文件直接加载llama/llama 2/中文llama 的大语言模型的方法

Posted on 2023年8月4日 | By chinaoss

1 介绍两种方法实现：
2 模型文件有多个的情况：
3 Reference：

从本地直接加载已有的大语言模型文件，用命令方式或python编程方式从本地直接加载模型文件，适合于模型文件已下载到本地的情况，或者模型文件已随软件一起打包的情况、docker容器化部署的情况，也适用Chinese-Llama-2-7b，可避免部署运行时每次重新联网下载huggingface上的模型的麻烦。

介绍两种方法实现：

命令方式从本地文件直接加载llama/llama 2/中文llama 的大语言模型：
参考链接
1. 在本地编译得到 llama.cpp 的可执行文件（main）后，通过main 加载本地模型文件。
  linux下的编译 + 加载模型的命令为：
```
git clone https://github.com/ggerganov/llama.cpp;
cd llama.cpp && make -j && ./main -m ./models/7B/ggml-model-q4_0.bin -p "Building a website can be done in 10 simple steps:" -n 512
```

编程方式从本地文件直接加载llama/llama 2/中文llama 的大语言模型：

安装准备工作：
```
pip install llama-cpp-python
```
对 mac系统的支持、以及让llama.cpp支持使用 OpenBLAS / cuBLAS / CLBlast / Metal 作为后端的设置方法，可参考链接

编程实现

from llama_cpp import Llama
llm = Llama(model_path="./models/7B/ggml-model.bin")
output = llm("Q: Name the planets in the solar system? A: ", max_tokens=32, stop=["Q:", "\n"], echo=True)
print(output)

输出结果：

"id": "cmpl-xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx",
"object": "text_completion",
"created": 1679561337,
"model": "./models/7B/ggml-model.bin",
"choices": [
{
"text": "Q: Name the planets in the solar system?

… 查看余下内容

大语言模型如何合并与转换其他模型得到新的完整模型文件

Posted on 2023年8月3日 | By chinaoss

1 手动模型合并与转换

本文介绍了LoRA与原版Llama-2合并得到完整模型的流程本文介绍了LoRA与原版Llama-2合并得到完整模型的流程。本操作属于手动转换（离线转换模型的方式），用于生成不同格式的模型，以便进行量化或进一步精调。本文来源于：中文LLaMA-2 & Alpaca-2大语言模型 Chinese-LLaMA-Alpaca-2 项目的wiki页面 manual_conversion_zh

手动模型合并与转换

以下介绍了手动将LoRA与原版Llama-2合并得到完整模型的流程。如网络带宽充足，建议直接下载完整版模型。

准备工作

运行前确保拉取【中文LLaMA-2 & Alpaca-2大语言模型 Chinese-LLaMA-Alpaca-2】仓库最新版代码：git pull https://github.com/ymcui/Chinese-LLaMA-Alpaca-2
确保机器有足够的内存加载完整模型（例如7B模型需要13-15G）以进行合并模型操作
安装依赖库（项目根目录requirements.txt）：

$ pip install -r requirements.txt

Step 1: 获取原版Llama-2-hf模型

原版Llama-2-hf地址：https://huggingface.co/meta-llama/Llama-2-7b-hf

HF格式模型相关文件（可以不用下载safetensors格式模型权重）：

config.json
generation_config.json
pytorch_model-00001-of-00002.bin
pytorch_model-00002-of-00002.bin
pytorch_model.bin.index.json
special_tokens_map.json
tokenizer_config.json
tokenizer.json
tokenizer.model

Step 2: 合并LoRA权重，生成全量模型权重

这一步骤会合并LoRA权重，生成全量模型权重。此处可以选择输出PyTorch版本权重（.pth文件）或者输出HuggingFace版本权重（.bin文件）。执行以下命令：

$ python scripts/merge_llama2_with_chinese_lora_low_mem.py \
    --base_model path_to_original_llama2_hf_dir \
    --lora_model path_to_chinese_llama2_or_alpaca2_lora \
    --output_type huggingface \
    --output_dir path_to_output_dir

参数说明：

--base_model：存放HF格式的Llama-2模型权重和配置文件的目录
--lora_model：中文LLaMA-2/Alpaca-2 LoRA解压后文件所在目录，也可使用🤗Model Hub模型调用名称（会自动下载）
--output_type：指定输出格式，可为pth或huggingface。若不指定，默认为huggingface
--output_dir：指定保存全量模型权重的目录，默认为./
（可选）--verbose：显示合并过程中的详细信息

… 查看余下内容

如何在 PaddleOCR 中设置使用 GPU/CPU计算能力？

Posted on 2023年8月1日 | By chinaoss

paddlepaddle的paddleOCR在安装配置阶段，要选对下载的版本，才能支持GPU模式，否则默认支持的是CPU模式

要在 PaddleOCR 中使用 GPU，您需要遵循几个步骤：

安装 PaddlePaddle 的 GPU 版本：确保已安装 PaddlePaddle 的 GPU 版本，其中包括 CUDA 和 cuDNN 支持。你可以按照 PaddlePaddle官方的这个文档中提供的说明进行安装。注意选择对应的CUDA版本、操作系统版本、安装渠道等。
检查 GPU 可用性：确保 PaddlePaddle 能正确识别你的 GPU。你可以运行以下代码片段来检查PaddlePaddle是否能检测到你的GPU：

import paddle
gpu_available  = paddle.device.is_compiled_with_cuda()
print("GPU available:", gpu_available)

如果输出为 True，则表示 PaddlePaddle 已检测到 GPU。

在 PaddleOCR 中设置 use_gpu 标志：在代码或配置文件中，确保将 use_gpu 标志设置为 True，以启用 GPU 的使用。例如，如果您使用的是 PaddleOCR API，可以这样设置：

from paddleocr import PaddleOCR
ocr = PaddleOCR(use_gpu=True)

如果使用配置文件，请在配置文件中将 use_gpu 标志设置为 true。

在推理过程中检查 GPU 的使用情况：使用 PaddleOCR 执行推理时，可以使用 nvidia-smi（用于英伟达™（NVIDIA®）GPU）等工具或其他 GPU 监控工具监控 GPU 的使用情况。这将帮助你验证 GPU 是否在推理过程中被使用。

如果您已按照上述步骤操作，但仍遇到 PaddleOCR 使用 CPU 而非 GPU 的问题，则可能是其他因素导致了该问题。请确保您的系统环境和依赖项已正确设置为使用 GPU，并仔细检查是否安装了支持 GPU 的 PaddlePaddle。此外，检查 PaddleOCR 初始化或推理过程中的任何错误信息或警告，因为它们可能提供更多有关问题的信息。… 查看余下内容