提交自己开发的R包到CRAN或Bioconductor

2023年5月31日下午10:00 • 技术杂谈 • 阅读 112

2023年02月09日

Note：要在包里加入新的data，就必须同名，在R里的名字要和文件名一模一样，否则会报错。（Error: ‘mouse.house.keeping.gene’ is not an exported object from ‘namespace:bt2m’）

2023年01月17日

namespace文件里的标点符号要特别注意，逗号句号。

主函数里面的函数头描述非常重要，不要重复。

一旦框架搭起来了，后面开发就简单了。

在notebook里做分析，可视化，然后把代码打包起来，有一个基本的函数就可以了；

函数的调试有点复杂，那么可以直接去壳运行（API赋值），直接查看每一步的结果是否符合预期，不符合就不断debug调试；

复杂一点的函数非常有必要画一个算法流程图，明确每一步都是在干啥；

上面的命令第一步就是检车包、生成文档，第二步就是生成pdf。

这个才是完成的编译包的命令。

需要clean包里的内容

notebook
bt2m.pdf

check之后必须解决所有warnings才能build。

常见有如下几种warnings

Namespaces in Imports field not imported from:

This message appears when you include a package in the Imports: field in DESCRIPTION file and no function in this namespace is called by any function of the package. In this case, it means that in the R code of the package there was no call like tydir::fun, where fun represents any function of that package.

To solve it, simply delete the reference to the package in Imports: field within DESCRIPTION file. This was fixed in this commit for the package involved in the question: clustRcompaR.

Undocumented arguments in documentation object

去修改指定函数的document就行

Files not of a type allowed in a ‘data’ directory:

删掉无关文件

Note: significantly better compression could be obtained

压缩rda

2023年01月11日

整体流程就是：
1. 从空包开始，添加函数、数据，确保包能被devtools正常编译安装；
2. 自动构建document，生成GitHub page；
3. 不断调试优化，添加新功能；

在DFCI二次启动，又有了一些新的想法，iterbi换个马甲，bt2m这个名字更加经典。

重新配置基本的开发环境，R studio和R，Mac上就不要用conda了，因为搞不了什么大数据分析，容易紊乱。【不要让两个R kernel共享一个libPath，会corrupt】

直接用conda里的R的开发环境，不要用Rstudio，除非万不得已。

基本的devtools，生成PDF时需要用MacTeX，在Mac上安装一下。【那Linux就没法生成了？】需要一些依赖包。

走了很多弯路，最后这个解决了，字体的原因。【不要用MacPort，Mac就用Brew】

以及自己包所依赖的一些包，建议不要依赖太复杂的包，容易安装失败，然后用户就直接退出了。

用pkgdown来开发R包的网站，非常方便。

做生信的最终梦想，就是自己开发一款热度极高的R包，在历史上留下一笔。

取个R包名，这个后面就不要改了；
用Rstudio来创建和管理R包；
链接到GitHub备份【推荐GitHub desktop】；

R里面的独立脚本

data.R
visualization.R
bifurcated_clustering.R
differential_expression.R

加入新的功能文件夹

data
inst
vignettes
在本地测试开发R代码，函数名、变量名取好一点，然后就可以导入到包的R文件夹里了；

这是最主要的步骤，需要耐心设计，基本包含了包的全部功能。

最开始，随便哪一个开发数据集，在jupyter里以数据分析的形式开始开发，能分析出自己满意的结果未知；
然后，模块化，按核心功能，把代码封装成函数，设置好参数和输出结果；
接着，重命名关键变量和函数，将函数导入到R package里开始以source的方式调试；
然后，在函数上面写doc，这个比较简单；
最后，在GitHub发布R包，安装后，最少用5种不同的数据集测试代码，发现bug，然后debug，循环几次就差不多了。

函数命名法则

驼峰命名法，首字母大写，单词间不要间隔，以后每个单词首字母大写
“.”用于结尾，表示多态性
名字不太太长，否则很丑，名字多是动词短语或名词
用sublime批量修改比较方便

变量命名

变量统一小写
变量用”.”分割

包的设置

DESCRIPTION文件

主要是import package、author的格式

gitdoc自动生成文档

每次运行之前记得备份namespace文件，会自动覆盖。

测试【check之前必须移除无关的文件，比如pdf，教程文档等】

其实写个包还是挺难的，有太多注意事项了。

很多事情都要不断的打磨：

泛化，随着测试数据集的变化，总有不同的condition，就需要不断的泛化
命名，根据对分析理解的加深，会有新的命名方法

删掉所有注释再提交到GitHub

设计原则

如何提交到Bioconductor？

文章发表

如果真想做一个好包，那就把开发的逻辑梳理清楚，然后投稿，差不多接收了就可以把包提交到bioconductor。

一些报错

Error in get(genname, envir = envir) : object ‘testthat_print’ not found

rlang is a collection of frameworks and APIs for programming with R.

Update testthat to 3.0.0 or newer.

Dependence on R version ‘3.6.2’ not with patchlevel 0

CRAN check warning: Dependence on R version ‘3.4.3’ not with patchlevel 0 【不要到补丁号】
roxygen2 generate namespace【自动生产新定义的函数，在namespace文件里自动export一下】
Namespace dependencies not required 【所有在namespace里import的都要在description里import】
Error: object ‘str_wrap’ is not exported by ‘namespace:ggplot2’ 【搞错了】
Undefined global functions or variables 【dataframe等的列名，需要加入global】

【description里面一个要句号，一个不能有句号，要求很严格】

Malformed Title field: should not end in a period.

Malformed Description field: should contain one or more complete sentences.

参考：

Original: https://www.cnblogs.com/leezx/p/16111833.html
Author: Life·Intelligence
Title: 提交自己开发的R包到CRAN或Bioconductor

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/552403/

转载文章受原作者版权保护。转载请注明原作者出处！

技术杂谈

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【MAT-MemoryAnalyzer】使用快速排查问题

【MAT-MemoryAnalyzer】使用快速排查问题引用地址：https://blog.csdn.net/lyd135364/article/details/12144996…

技术杂谈 2023年5月30日
0088
crash命令 —— waitq

参考：https://crash-utility.github.io/help_pages/waitq.html 用法：查看等待队列中被阻塞的进程 waitq <等待队列地…

技术杂谈 2023年5月30日
0099
操作系统复习错题集合

操作系统复习错题集合主要记一下这个写操作，是增删目录中的目录项文件有逻辑结构和物理结构，逻辑结构有流式和记录式，物理结构有顺序式、索引式、链接式 UNIX题目一概背记。…

技术杂谈 2023年7月11日
0067
Django框架

Original: https://www.cnblogs.com/695189322/p/16500888.htmlAuthor: python00000001Title: Dj…

技术杂谈 2023年6月21日
0083
一文看懂Power Platform 和 Teams的整合

大家知道，Microsoft Teams 正在飞速增长，目前每天的活跃商业用户大约在1.5亿左右，各地用户通过Teams开会的时间，每天超过50亿分钟；另外一方面，全球财富500强…

技术杂谈 2023年5月31日
0098
windows使用挂载盘提供FTP服务

环境说明： NFS服务器：centos7.0 IP：192.168.18.10 FTP服务器：windows server 2008 IP：192.168.18.41 准备工作： …

技术杂谈 2023年7月24日
0072
浅析vue3在源码、性能和语法上对比vue2做了哪些优化

Vue.js 从 1.x 到 2.0 版本，最大的升级就是引入了虚拟 DOM 的概念，它为后续做服务端渲染以及跨端框架 Weex 提供了基础。 Vue.js 2.x 发展了很久，现…

技术杂谈 2023年5月31日
0087
Warning:file_get_contents():SSL operation failed with code 1

今天使用PHP写程序获取指定接口的内容，获取内容为空加上报错报错提示显示SSL operation failed with code 1，接下来吾爱编程为大家介绍一下解决方法，有需…

技术杂谈 2023年5月31日
0070
AOP与注解的那些事儿~

前言什么是AOP？ AOP的相关概念（面试常客） Spring Boot 如何整合AOP自定义一个注解？使用拦截器如何自定义注解？内部调用导致AOP注解失效总结注解相信大…

技术杂谈 2023年7月24日
0080
云E办接口文档

简介：云E办接口文档 HOST:localhost:8081 联系人:wanglufei Version:1.0 接口路径：/v2/api-docs 验证码接口描述: 接口地址…

技术杂谈 2023年7月11日
0060
62.可

sdfdsf posted @2022-09-28 08:36 随遇而安== 阅读(4 ) 评论() 编辑 Original: https://www.cnblogs.com/55…

技术杂谈 2023年6月21日
00102
熟悉javaEE主流框架Springboot，SpringCloud，Mybatis，了解Servlet，JDBC

什么是Tomcat 阿帕奇提供的小型服务器软件，支持servet和jsp规范 lib包：存放jar包 WabApp:发布项目的目录 work:jsp编译生成。class的目录 LO…

技术杂谈 2023年7月23日
0064
Python可视化打包 exe，这个神器绝了

auto-py-to-exe 是一个用于将Python程序打包成可执行文件的图形化工具。本文就是主要介绍如何使用 auto-py-to-exe 完成 python 程序打包。aut…

技术杂谈 2023年6月21日
0092
C 中的字符数组

在C语言中没有专门的字符串变量，字符串实际上是使用 null 字符 \0 终止的一维字符数组。因此，一个以 null 结尾的字符串，包含了组成字符串的字符。通常用一个字符数组来存…

技术杂谈 2023年7月10日
0099
Redrain个人维护并使用的DuiLib和UiLib库源代码下载地址

首先说明一下Duilib和Uilib的差别：UiLIb是DuiLib是升级扩展版，UiLib添加了一些控件，比方渐变的FadeButton。而且增强了不少控件的功能和属性，比方托盘…

技术杂谈 2023年5月31日
0087
腾讯云EKS 上部署 eshopondapr

腾讯云容器服务（Tencent Kubernetes Engine，TKE）基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务。腾讯云容器服务完全兼…

技术杂谈 2023年5月31日
00106

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31