0%

numpy数组

查看形状

numpy

print(f"before transpose img_f shape is {img_f.shape}")

一般PIL图像都是HWC,一般张量都是CHW,所以用 image = img.permute(2, 0, 1)来调换通道

PIL

print(Image.open(image_path))就可以查看一个图像的基本信息

<PIL.Image.Image image mode=RGB size=320x320 at 0x7FA27DF10910>

张量

张量要求输入是四维,所以如果只有1张图片,要修改

张量与PIL之间转换

1
2
3
4
5
6
7
8
9
10
11
12
13
14
import torch
from PIL import Image

# 加载图片并转换为张量
image = Image.open('/home/ztb/alg_mini/computer_design/sbi数据集/faces/1.png')
transform = torchvision.transforms.ToTensor()
image_tensor = transform(image)

# 添加批量维度并调整通道顺序
image_tensor = image_tensor.unsqueeze(0) # 添加批量维度
image_tensor = image_tensor.permute(0, 2, 3, 1) # 调整通道顺序

# 将图片输入模型进行推理
output = model(image_tensor)

输入模型的张量格式通常是一个四维张量,其形状为 [batch_size, channels, height, width],其中:

  • batch_size 表示每个批次中样本的数量。
  • channels 表示图片的通道数,对于彩色图片通常为3(R、G、B),对于灰度图片通常为1。
  • height 表示图片的高度。
  • width 表示图片的宽度。

这种格式通常称为 CHW 格式,因为通道在前,高度在中间,宽度在最后。

图像值的变换

为什么一会float / 255,一会有int * 255

上传文件到远程服务器

scp -r -P 12243 I:ztb@43.139.180.140:/home/ztb

快速上传

scp -r -P 22 -C I:ztb@10.154.24.17:/home/ztb

指定显卡

CUDA_VISIBLE_DEVICES=3

发现无法使用包,自己写的包无法导入

在需要使用导入包代码前写

import sys sys.path.append('/home/ztb/experiment')

然后from …… import ……

其中append假第一个……组成被导入包的绝对路径

指令是指示计算机执行某种操作的命令, 是计算机运行的最小功能单位

一台计算机的所有指令的集合构成该机的指令系统,也称为指令集

指令的基本格式

阅读全文 »