STANet_pytorch代码问题汇总、附上裁剪图片代码(有问留言必答)

2023年7月20日下午7:47 • 人工智能 • 阅读 55

STANet_pytorch代码问题汇总、附上裁剪图片代码

*
– 一、 STANet
– 二、问题汇总与解答（如列不全，请留言）
–
+ 1.安装虚拟环境与相关库的的条件：
+ 2. 查看代码中的readme.md文件（里面有跑代码的方式、模型与数据集链接）
+ 3. python demo.py 的问题
+ 4.跑BAM、PAM代码中常见的Out of memory 2 (64、256)GiB 问题
– 三、裁剪代码实现
–
+ 说明：

一、 STANet

因有一部分实验用到STANet网络，在网上找到相应的代码，花了大概一周一步步跳入坑、填坑的过程，苦于将其跑通，遂记录如下心得，希望能够帮助有需要的小伙伴避开”雷区”！

文章源于：
代码源于：
大致看了一下该篇文章，网上有很多解读的博客，不做过多介绍，简而言之，该文章通过利用自注意力机制模块（BAM）和（多个BAM集成的PAM块），对遥感影像进行特征提取与训练, 通过对比两张不同时期的遥感图像，以深度学习的方法训练模型，最后能够”自动比对”找出同一区域，不同时间的变化情况。下图是STANet文章的截图。
文章能够显著检测出遥感影像中变化的建筑物，可以应用于违章建筑拓展监测、乡村扶贫振兴和生态移民居住保障的风貌变化程度。
相关的数据集包括（train、每train一轮epch之后紧接着验证val集，还有训练结束之后，将保存的model进行测试的test集（PS: 文章代码的测试部分，称为val，python val.py 就是测试，而不是验证)）。
每一个数据集中包括：
———–| A：前一段时间的遥感图像（1024 * 1024）；
———–| B：后一段时间的相同区域的遥感图像（1024*1024) ；
———–| label：标注好两幅遥感图像之间存在的变化，因为数据中考虑一个类别（建筑物）的变化情况，以二值图形式（黑白）进行展示（1024*1024））。
！命名一定要一致！

; 二、问题汇总与解答（如列不全，请留言）

*1.安装虚拟环境与相关库的的条件：

visdom=0.1.8.1 或者修改可视化版本visdom=0.1.8.8；
*

&#x4E0D;&#x7136;&#x53EF;&#x80FD;&#x5728;&#x6D4B;&#x8BD5;&#x7684;&#x65F6;&#x5019;&#xFF0C;&#x4F1A;&#x51FA;&#x73B0;&#xFF1A;AssertionError: X and Y should be the same shape

scipy=1.1.0：因为1.2.0版本的scipy没有 imread,也会报错。

2. 查看代码中的readme.md文件（里面有跑代码的方式、模型与数据集链接）

如果开始想python demo.py，先下载文章训练好的模型、LEVIR-CD数据集（README.md中有百度网盘、谷歌云盘这两种形式的链接）添加到相应的位置。
在运行代码过程中，多半会出现no file 报错，就按照报错的提示，

3. python demo.py 的问题

TypeError: Cannot handle this data type: (1, 1, 64), |u ：听说是因为Python版本问题：我的python=3.6.12没有问题。

4.跑BAM、PAM代码中常见的Out of memory 2 (64、256)GiB 问题

首先：【Out of memory 2 GIB】主要是显存不够，很有效的做法就是减低 batch_size 8 –>4;
其次：降batch size 8 为 4 之后，运行代码，实验跑1 个epoch后，紧跟的val就会出现【Out of memory 256GiB】，因为val验证的代码没有将1024裁剪为256，服务器的计算资源不够。需要 分别裁剪val 文件中的 A B label ，然后更改python train.py 后面的 val_data_path的路径到裁剪的val 文件夹（如 val_256）即可，代码后续放出。
记得将后面测试的 test文件夹的图片也裁剪， 同样地，分别裁剪 A B label，不裁剪可能会【Out of memory 64 GiB】。

三、裁剪代码实现


import os
import os.path as osp
import sys
from multiprocessing import Pool
import numpy as np
import cv2
from PIL import Image
import time
from shutil import get_terminal_size

sys.path.append(osp.dirname(osp.dirname(osp.abspath(__file__))))

def main():
    mode = 'pair'
    opt = {}
    opt['n_thread'] = 20
    opt['compression_level'] = 3

    if mode == 'single':
        opt['input_folder'] = './data/DIV2K/DIV2K_train_HR'
        opt['save_folder'] = './data/DIV2K/DIV2K800_sub'
        opt['crop_sz'] = 480
        opt['step'] = 240
        opt['thres_sz'] = 48
        extract_signle(opt)

    elif mode == 'pair':
        GT_folder = '/home/cug210/data/Lover/code/STANet-master/LEVIR-CD/test/B'
        save_GT_folder = '/home/cug210/data/Lover/code/STANet-master/LEVIR-CD/test_256/B'
        crop_sz = 256
        step = 256
        thres_sz = 256

        img_GT_list = _get_paths_from_images(GT_folder)

        print('process GT...')
        opt['input_folder'] = GT_folder
        opt['save_folder'] = save_GT_folder
        opt['crop_sz'] = crop_sz
        opt['step'] = step
        opt['thres_sz'] = thres_sz
        extract_signle(opt)

    else:
        raise ValueError('Wrong mode.')

def extract_signle(opt):
    input_folder = opt['input_folder']
    save_folder = opt['save_folder']
    if not osp.exists(save_folder):
        os.makedirs(save_folder)
        print('mkdir [{:s}] ...'.format(save_folder))
    else:
        print('Folder [{:s}] already exists. Exit...'.format(save_folder))
        sys.exit(1)
    img_list = _get_paths_from_images(input_folder)

    def update(arg):
        pbar.update(arg)

    pbar = ProgressBar(len(img_list))

    pool = Pool(opt['n_thread'])
    for path in img_list:
        pool.apply_async(worker, args=(path, opt), callback=update)
    pool.close()
    pool.join()
    print('All subprocesses done.')

def worker(path, opt):
    crop_sz = opt['crop_sz']
    step = opt['step']
    thres_sz = opt['thres_sz']
    img_name = osp.basename(path)
    img = cv2.imread(path, cv2.IMREAD_UNCHANGED)

    n_channels = len(img.shape)
    if n_channels == 2:
        h, w = img.shape
    elif n_channels == 3:
        h, w, c = img.shape
    else:
        raise ValueError('Wrong image shape - {}'.format(n_channels))

    h_space = np.arange(0, h - crop_sz + 1, step)
    if h - (h_space[-1] + crop_sz) > thres_sz:
        h_space = np.append(h_space, h - crop_sz)
    w_space = np.arange(0, w - crop_sz + 1, step)
    if w - (w_space[-1] + crop_sz) > thres_sz:
        w_space = np.append(w_space, w - crop_sz)

    index = 0
    for x in h_space:
        for y in w_space:
            index += 1
            if n_channels == 2:
                crop_img = img[x:x + crop_sz, y:y + crop_sz]
            else:
                crop_img = img[x:x + crop_sz, y:y + crop_sz, :]
            crop_img = np.ascontiguousarray(crop_img)
            cv2.imwrite(
                osp.join(opt['save_folder'],
                         img_name.replace('.png', '_s{:03d}.png'.format(index))), crop_img,
                [cv2.IMWRITE_PNG_COMPRESSION, opt['compression_level']])
    return 'Processing {:s} ...'.format(img_name)

class ProgressBar(object):
    '''A progress bar which can print the progress
    modified from https://github.com/hellock/cvbase/blob/master/cvbase/progress.py
    '''

    def __init__(self, task_num=0, bar_width=50, start=True):
        self.task_num = task_num
        max_bar_width = self._get_max_bar_width()
        self.bar_width = (bar_width if bar_width  max_bar_width else max_bar_width)
        self.completed = 0
        if start:
            self.start()

    def _get_max_bar_width(self):
        terminal_width, _ = get_terminal_size()
        max_bar_width = min(int(terminal_width * 0.6), terminal_width - 50)
        if max_bar_width < 10:
            print('terminal width is too small ({}), please consider widen the terminal for better '
                  'progressbar visualization'.format(terminal_width))
            max_bar_width = 10
        return max_bar_width

    def start(self):
        if self.task_num > 0:
            sys.stdout.write('[{}] 0/{}, elapsed: 0s, ETA:\n{}\n'.format(
                ' ' * self.bar_width, self.task_num, 'Start...'))
        else:
            sys.stdout.write('completed: 0, elapsed: 0s')
        sys.stdout.flush()
        self.start_time = time.time()

    def update(self, msg='In progress...'):
        self.completed += 1
        elapsed = time.time() - self.start_time + 1e-9
        fps = self.completed / elapsed
        if self.task_num > 0:
            percentage = self.completed / float(self.task_num)
            eta = int(elapsed * (1 - percentage) / percentage + 0.5)
            mark_width = int(self.bar_width * percentage)
            bar_chars = '>' * mark_width + '-' * (self.bar_width - mark_width)
            sys.stdout.write('\033[2F')
            sys.stdout.write('\033[J')
            sys.stdout.write('[{}] {}/{}, {:.1f} task/s, elapsed: {}s, ETA: {:5}s\n{}\n'.format(
                bar_chars, self.completed, self.task_num, fps, int(elapsed + 0.5), eta, msg))
        else:
            sys.stdout.write('completed: {}, elapsed: {}s, {:.1f} tasks/s'.format(
                self.completed, int(elapsed + 0.5), fps))
        sys.stdout.flush()

IMG_EXTENSIONS = ['.jpg', '.JPG', '.jpeg', '.JPEG', '.png', '.PNG', '.ppm', '.PPM', '.bmp', '.BMP']

def is_image_file(filename):
    return any(filename.endswith(extension) for extension in IMG_EXTENSIONS)

def _get_paths_from_images(path):
    """get image path list from image folder"""
    assert osp.isdir(path), '{:s} is not a valid directory'.format(path)
    images = []
    for dirpath, _, fnames in sorted(os.walk(path)):
        for fname in sorted(fnames):
            print("..fname is:",fname)

            if is_image_file(fname):
                img_path = os.path.join(dirpath, fname)
                images.append(img_path)
    assert images, '{:s} has no valid image file'.format(path)
    return images

if __name__ == '__main__':
    main()

说明：

只需要更改32-36行的信息：
【原始文件夹路径】
【保存的裁剪后图片的文件夹路径】
【裁剪尺寸crop_size、位移尺寸step（两者相等，表示下一张图和第一张图没有重叠）】
【阈值（thres_sz）设置为256，表示裁剪到最后，剩下不到256的残缺，就不裁剪了。】

Original: https://blog.csdn.net/qq_45041702/article/details/121851147
Author: 未知量0520
Title: STANet_pytorch代码问题汇总、附上裁剪图片代码(有问留言必答)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/705619/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pandas -表的横向合并纵向合并

《Merge, join, and concatenate》笔记 PS默认情况下，所有合并函数生成文件的方式均是新生成，即不修改原DF/Series数据。常用 merge() 来…

人工智能 2023年7月8日
0074
数学建模学习（1）———— 逻辑回归的使用和案例（2022.7.18）

许多数学建模的使用基本都是一元线性回归，和多元线性回归开始，但由于经常看关于这两个东西，实在不想从这开始整理笔记，等后面印象不深后在整理过。文章目录目录文章目录一、逻辑回归…

人工智能 2023年6月16日
0056
最近大火的「元宇宙」是什么？

作者：腾讯技术工程特约撰稿人李佳华本文将介绍元宇宙的由来和底层技术，探讨海内外资本在这条赛道上的布局，元宇宙将会对哪些行业产生变革的影响，这些影响背后凸显了元宇宙的哪些价值，以…

人工智能 2023年7月25日
0052
【机器学习算法】关联规则-1 关联规则的概念，Apriori算法，实例和优缺点

目录关联规则关联规则的概念：关联规则的评估指标-评估指标也就是支持度和置信度APriori算法Apriori的步骤Apriori算法的实例说明Apriori算法的实例的缺点及瓶颈…

人工智能 2023年6月19日
00138
机器学习——时间序列ARIMA模型(四)：自相关函数ACF和偏自相关函数PACF用于判断ARIMA模型中p、q参数取值

文章目录 * – 1、自相关函数ACF – 2、偏自相关函数PACF – 3、ARIMA(p,d,q)的阶数判断 – 4、代码实现 …

人工智能 2023年6月15日
0098
深度学习-conv卷积

卷积卷积是一种定义在两个函数((f) 和 (g))上的数学操作，旨在产生一个新的函数。(f) 和 (g) 的卷积可以写成 (f\ast g)，数学定义如下： [\begin{al…

人工智能 2023年6月4日
00158
Pandas 5–数据高级处理（缺失值处理、数据离散化、合并、交叉表和透视表、分组和聚合）

文章目录一、缺失值处理 * 1.判断是否有缺失值 2.处理缺失值 – 1.删除 (把所有缺失的行删除) 2.替换 (把缺失值替换为平均值or中位数等) 3.有特殊标记…

人工智能 2023年7月17日
0059
论文阅读：《Attention Bottlenecks for Multimodal Fusion》

标题：MBT：多模态融合的注意力瓶颈多模态视频分类任务人类通过同时处理和融合来自视觉和音频等多种模态的高维输入来感知世界。目前的多模态任务存在着一定的问题： CVPR2020《…

人工智能 2023年6月4日
0099
基于树莓派的蓄电池控制系统

总概： (1)使用 Raspberry 4B作为主控芯片，通过不同模块采集信息。 (2)搭建BP神经网络模型并训练，根据采集信息算出蓄电池的补水量。 (3)使用PyQT编写人机交互…

人工智能 2023年6月28日
0078
【Python】pip超详细教程，pip的安装与使用，解决pip下载速度慢的问题

文章目录 1. pip的安装与卸载 * 1.1 pip的安装 1.2 pip的卸载 2. pip的使用 * 2.1 帮助信息 2.2 查看pip版本 2.3 更新pip版本 2.4…

人工智能 2023年7月3日
0073
从华为WeAutomate数字机器人论坛，看政企领域的“政务新智理”

从华为WeAutomate数字机器人论坛，看政企领域的”政务新智理” 从政务治理到”政务新智理”，华为WeAutomate在政务领域…

人工智能 2023年6月4日
0072
OCR文字识别技术总结（三）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月24日
0063
码农必备，一款超好用Json编辑工具

DevWeekly收集整理每周优质开发者内容，包括开源项目、资源工具、技术文章等方面。每周五定期发布，同步更新到知乎：Jackpop 。欢迎大家投稿，提交issue，推…

人工智能 2023年6月26日
00101
一图看懂对抗神经网络中判别器怎么工作的

先梳理问题，后解答 1、对GAN网络总有个疑问，判别器是依据什么进行判别的？依据又由何而来？这个问题至关重要，因为”依据”意味着有标签，人为提供给了神经…

人工智能 2023年7月13日
0056
模仿学习（Imitation Learning）概述

目录 1 算法介绍 1.1 什么是专家示范数据？ 1.2 Behavior Cloning 1.2.1 算法思路 1.2.2 算法步骤 1.2.3 算法特性 1.2.4 算法改进d…

人工智能 2023年6月15日
0091
高斯过程（Gaussian Processes）原理

高斯过程（Gaussian Processes, GP）是概率论和数理统计中随机过程的一种，是多元高斯分布的扩展，被应用于机器学习、信号处理等领域。博主在阅读了数篇文章和博客后才算…

人工智能 2023年6月13日
00105

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

STANet_pytorch代码问题汇总、附上裁剪图片代码(有问留言必答)

STANet_pytorch代码问题汇总、附上裁剪图片代码

一、 STANet

; 二、问题汇总与解答（如列不全，请留言）

三、裁剪代码实现

大家都在看