处理pdb文件

2023年8月27日下午10:15 • Python • 阅读 48

import os
from math import sqrt
import numpy
import torch
from Bio.PDB import PDBParser
from torch.utils.data import Dataset, DataLoader
from torch.utils.tensorboard import SummaryWriter

device = torch.device("cuda")

class P450Dataset(Dataset):
    def __init__(self, testp450, transform=None, target_transform=None):
        # 处理pdb数据
        path = './testp450'
        arr = []
        max_num = 0
        index = 0
        self.data = []
        # 遍历文件夹下的pdb文件名
        for filename in os.listdir('testp450'):
            p = PDBParser()
            struct_id = "1fat"
            filename = path + '/' + filename
            structure = p.get_structure(struct_id, filename)
            atoms = structure.get_atoms()
            atoms = list(atoms)

            # 获得一个结构中的原子总数
            atom_num = 0
            for atom in atoms:
                atom_num = atom_num + 1
            print(atom_num)
        #     arr.append(atom_num)
        # max_num = max(arr)
        # print(max_num)

            # 计算距离矩阵
            i = 0
            n = numpy.zeros(shape=(1, 1))
            a = numpy.zeros(shape=(atom_num ** 2, 1))
            b = numpy.zeros(shape=(atom_num, atom_num))

            # 快速遍历一个结构中的所有原子
            for atom in atoms:
                for ato in atoms:
                    n = sqrt((atom.get_coord()[0] - ato.get_coord()[0]) ** 2 +
                             (atom.get_coord()[1] - ato.get_coord()[1]) ** 2 +
                             (atom.get_coord()[2] - ato.get_coord()[2]) ** 2)
                    a[i] = n
                    i = i + 1

            # 创建距离矩阵
            m = 0
            for p in range(0, atom_num):
                for q in range(0, atom_num):
                    b[p][q] = a[m]
                    m = m + 1
            # print(b)
            # 把所有数据padding到同一大小，计算剩余需要填补
            padding_num = 4996 - atom_num
            # b = torch.tensor(b, dtype=torch.float32)
            b = numpy.pad(b, (0, padding_num), 'constant')
            b = torch.tensor(b, dtype=torch.float32)
            # b = torch.reshape(b, (1, 5000, 5000))
            b = b[numpy.newaxis, :, :]
            print(b)
            print(b.shape)
            # 首先读取数据，计算残基距离矩阵
            # 加载所有数据，处理成相应的格式，
            self.data.append(b)

        print(self.data)
        self.testp450 = testp450

    def __len__(self):
        # 返回数据集长度，（有多少数据）
        return len(self.data)

    def __getitem__(self, item):
        return self.data[item]

num_epochs = 1000
batch_size = 2
learning_rate = 1e-3
total_train_step = 0

model = autoencoder()
model.to(device)
criterion = nn.MSELoss()
criterion.to(device)
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)
dataset = P450Dataset(testp450="testp450")
dataloader = DataLoader(dataset, batch_size, shuffle=True)
writer = SummaryWriter("./logs_testp450")

for epoch in range(num_epochs):
    for data in dataloader:
        img = data
        img = img.to(device)
        # print(img.shape)
        # ===================forward=====================
        output = model(img)
        # print(output.shape)
        loss = criterion(output, img)
        # ===================backward====================
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_train_step = total_train_step + 1
        if total_train_step % 100 == 0:
            print("训练次数：{}，Loss：{}".format(total_train_step, loss.item()))
        writer.add_scalar("train_loss1000", loss.item(), total_train_step)

writer.close()

Original: https://blog.csdn.net/qq_40223341/article/details/121577188
Author: 小新壹鸢
Title: 处理pdb文件

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/761448/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pytest自动化测试学习部分遇到的问题总结（持续更新）

1、很久不用pycharm，新建一个测试项目后，拷贝了上一个项目的部分代码，发现 allure安装不成功，检查了所有该有的配置也不成功（这个问题的过程被我不小心关掉了，没有放截图…

Python 2023年9月13日
0072
COCO数据集的介绍和使用

这篇文章是我研究生阶段入学期间学习所记，主要供自己使用，结合了论文原作和源码，中间借鉴的一些b站的视频以及他人博客的解释，会在文章末尾贴出链接。目录 COCO数据集的介绍 COC…

Python 2023年9月29日
0069
Django(drf)中使用FileField的使用方法

使用 Django rest framenwork 框架开发后台服务程序时，解决文件（图片还能用 ImageField）上传和下载的问题。在项目根目录下创建 media/ ，如果…

Python 2023年8月4日
0048
软件使用笔记

点击file->preference: 选择 configure conda ： always_yes: true channels: – def…

Python 2023年9月25日
0028
YOLOv5算法详解

1：输入端（1） Mosaic数据增强 Yolov5的输入端采用了和Yolov4一样的Mosaic数据增强的方式。Mosaic是参考2019年底提出的CutMix数据增强的方式，…

Python 2023年8月1日
0046
复现CVE-2017-7233（Django url跳转漏洞）

警告请勿使用本文提到的内容违反法律。本文不提供任何担保。一、url跳转漏洞介绍由于web应用越来越多的需要和其他的第三方应用交互，以及在自身应用内部根据不同的逻辑将用户引…

Python 2023年8月4日
0054
python及pygame雷霆战机游戏项目实战03 碰撞检测

在这个系列中，将制作一个雷霆战机游戏。 ; 碰撞碰撞是游戏开发的基本部分。 _碰撞检测_意味着您要检测游戏世界中的一个对象是否正在触碰另一个对象。 _碰撞反应_决定了碰撞发生时你…

Python 2023年9月19日
0045
pytest（三）requests

requests用来发送http请求以及接受http响应的python第三方库，主要用于接口自动化测试。安装：pip install requests 二、requests库常用…

Python 2023年9月12日
0042
python程序的分支结构（专题）

python程序的分支结构前言程序的分支结构分为三种，分别是单分支结构，二分支结构，多分支结构。同时需要掌握条件判断及组合，程序的异常处理。一、单分支结构根据判断条件结果而…

Python 2023年8月24日
0054
小程序canvas 缩放/拖动/还原/封装和实例–开箱即用

小程序canvas 缩放/拖动/还原/封装和实例一、预览二、使用 * 2.1 创建和配置方法三、源码 * 3.1 实例组件 3.2 核心类 3.2 工具类一、预览之前写…

Python 2023年10月7日
0066
Pytest（14）pytest.ini配置文件

pytest配置文件可以改变pytest的运行方式，它是一个固定的文件pytest.ini文件，读取配置信息，按指定的方式去运行 pytest -h 找到以下内容 [pytest]…

Python 2023年9月15日
0043
三步解决error: Microsoft Visual C++ 14.0 or greater is required. Get it with “Microsoft C++ Build Tools“

最近购置了一台新电脑，在anaconda prompt中使用pip安装python程序包报错，试了很多网上的方法都没成功。现在终于解决啦，希望能帮助后来人。我在prompt中运行…

Python 2023年8月2日
0047
ECCV2022_Slimmable:(ARM-Net)ARM Any-Time Super-Resolution Method

Institute：MAC Lab, Department of Artificial Intelligence, Xiamen University Author：Bohong …

Python 2023年10月28日
0036
Numpy(基于jupyter)

NumPy 是一个 Python 包，代表 “Numeric Python” 是一个由多维数组对象和用于处理数组的例程集合组成的库本文内容包括：一、创建N…

Python 2023年8月26日
0062
Python基础语法(十四)–对象之类方法和静态方法

类对象 class Tools: # 定义类&a…

Python 2023年6月10日
0066
二、Matplotlib数据可视化-散点图

一、概念散点图显示两组数据的值,每个点的坐标位置由变量的值决定。·由一组不连接的点完成，用于观察两种变量的相关性。例如身高-体重、温度-纬度、等等。二、绘制一个简单的散点图 i…

Python 2023年9月5日
0047

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

处理pdb文件

大家都在看