centos 运行rstudio?centos查看运行的进程
大家好,关于centos 运行rstudio很多朋友都还不太明白,不过没关系,因为今天小编就来为大家分享关于centos查看运行的进程的知识点,相信应该可以解决大家的一些困惑和问题,如果碰巧可以解决您的问题,还望关注下本站哦,希望对各位有所帮助!
如何高效地使用RStudio
RStudio Server是 RStudio公司打造的一款基于 Web的开源编辑器,如果你熟悉 RStudio的桌面版本,那么使用RStudio Server对你来说基本上没什么难度。
在
实际的工程中,我们的服务器大多是基于Linux的,比如常见的 ubuntu、centos
等。这些操作系统有时并不提供图形化界面,这时候RStudio的服务器版本就派上用场了。启动RStudio
Server后,进入在浏览器中进入某一个页面后就可以像桌面版一样使用RStudio编辑器。当R的代码在服务器上出现bug了,线上的hotfix是
在所难免的,这时候必然会用到 RStudio Server应个急。
这一次,我们将继续利用Docker神器,快速初始化RStudio Server环境的配置,并结合Git实现代码的版本控制。
准备
一个 Ubuntu服务器
第一步:安装 RStudio Server
首先,我们通过docker安装一个标准的RStudio Server
docker pull quantumobject/docker-rstudio
docker run-d-p 8787:8787 quantumobject/docker-rstudio
这样在你的电脑的8787端口就可以访问到rstudio的登陆界面了。
第二步:初始化 RStudio账号
接着,我们需要初始化一个rstudio的账号
docker exec-it container-id/bin/bash
adduser harryzhu#设置新用户名
passwd harryzhu#设置该用户的密码
mkdir/home/harryzhu#初始化工作空间
chmod-R harryzhu/home/harryzhu#给工作空间赋权
第三步:安装 git
然后,我们进入rstudio的服务器,我们打算引入git版本控制
sudo apt-get install git-core
第四步:解决 ssh的认证问题
使用 git的过程可能遇到SSL certificate problem。对于ssh的问题,我们可以选择建立一个ssh认证的key,也可以在git中设置为忽略。
生成一个key:
$ssh-keygen-t rsa
Generating public/private rsa key pair.
Enter file in which to save the key(/root/.ssh/id_rsa):
Created directory'/root/.ssh'.
连续按下回车,跳过密码设置
显示秘钥信息:
sudo cat/root/.ssh/id_rsa.pub
如果没有ssh认证的需求,也可以选择忽略:
git config--global http.sslVerify false
第五步:在 RStudio Server中配置Git
在最上方的菜单栏中可以选择Project Options。
接着填写配置。
第六步:克隆 Git项目到本地
Git功能已经集成在 RStudio-Server中了,在新建项目时可以选择新建一个Version Control的 Git项目。
大功告成!
参考资料
docker-rstudio手册
张丹老师的 RStudio-Server配置实战
Rstudio官方 git解决方案
刘坤老师的 Git中文教程
---------------------------------------------------------------------------------------------------------------
概述
本文根据 Rstudio Webinars的教程资源对Rstudio流的R语言教程做一个汇总,可以看到Rstudio对统计报告的Web化和工程化做了大量贡献。感谢Rstudio的众多工程师在开源的道路上的贡献!
谢溢辉:LaTex/Word的统计报告大逃亡之Rmarkdown生态
教学视频地址
在可交互、可复用的统计报告中,谢溢辉将介绍一众R包,包括 knitr、rmarkdown、htmlwidgets、DT、leaflet以及shiny。
快速标准的论文书写#$something$或者$$something$$可以解决数学公式的问题
#利用 bib文件和[@something]可以解决引用的问题
#同样的,你也可以根据一些机构要求引入标准的模板。
参考谢溢辉的Rmarkdown论文
参考谢溢辉的bib文件
屏蔽源码# ```{r echo=F}屏蔽源代码
# ```{r, fig.width=5, fig.height=4}设置配图大小
#脚注
代码段内存共享
利用cache选项复用代码和数据
Sys.sleep(5)
rnorm(1)
输出其他语言代码
利用engine选项选择代码引擎,驱动python、R、scala、Rcpp、bash、perl、node等
x='hello, python
world!'
print(x)
print(x.split(''))
交互式文档
利用yaml配置中的runtime选项
---
author: Harry Zhu
output: html_document
runtime: shiny
---
同理,你也可以选择输出slide、pdf或者word,你甚至可以给html定制一个css皮肤。
在我看来,rmarkdown是一款超越Zeppelin和iPython notebook的产品。
最总要的意义在于,学术工作者和工程师们不仅仅可以摆脱格式对创作的束缚专注于代码和文档,更是随意输出pdf、slide、html、word、latex等多种格式,形成强有力的跨界冲击。
谢溢辉本人有超过10年以上的LaTex使用经验,他的rmarkdown和knitr造福了一代学术工作者,显然LaTex和Word的体系在这种降维攻击下已经摇摇欲坠。
Hadley Wickham:R与大数据共舞
教学视频地址
R是一门为小数据探索和开发设计的语言,但在生产中R和大数据在一起还能发挥作用吗?我们定义数据量大于单机内存的数据为大数据。让我们对比一下大数据与小数据的生命周期。
一个小数据分析项目的生命周期:
阐明:熟悉数据、模板解决方案
开发:创建有效模型
产品化:自动化与集成
发布:社会化
一个大数据分析项目的生命周期:
切片:抽取部分数据
阐明:熟悉数据、模板解决方案
开发:创建有效模型
扩展:使用到整个数据集
产品化:自动化与集成
发布:社会化
dplyr与数据读取
教学视频地址
PackageDBMSsrc_sqlite()SQLitesrc_mysqlMySQLsrc_postgresPostgreSQLlibrary(bigquery) src_bigquery()Google BigQuery
显示SQLshow_query(clean)
中间缓存
collapse()返回正在处理的结果
#抽取 1%的训练数据
random<- clean%>%
mutate(x= random())%>%
collapse()%>%
filter(x<= 0.01)%>%
select(-x)%>%
collect()
数据存储
copy_to()根据本地的data frame在数据库创建一个表
# air为connection名称,query5为data frame,"gains"为表名
copy_to(air, query5, name="gains")
#关闭连接
rm(air)
#垃圾收集器
gc()
Hadley Wickham:ETL
教学视频地址
本节将讨论一个有效的数据分析/数据科学问题框架,包括:
数据读取 readr/httr/DBI
数据清洗 tidyr/jsonlite
数据处理 dplyr/rlist
数据可视化 ggplot2/ggvis
数据建模 broom
broom:快速分析install.packages("broom")
#查看相关例子
browseVignettes(package="broom")
Hadley Wickham是RStudio的首席科学家,并兼任统计莱斯大学的兼职教授。他将一一介绍他认为你应该知道的各种R包,并概述大数据和R,但主要是解释为什么他相信你不应该担心大数据的问题。
garrettgman:packrat与虚拟化技术
教学视频地址
你
是否有过这样与人合作开发的经历:在自己机器上运行完美的R代码,复制到另外一台同事的机器上运行就有很多R包需要重新安装,有的R包甚至依赖于不同的版
本?现在,在不使用Docker或Vagrant等全局虚拟化技术的条件下,只需要运用packrat包,就可以保证你的R项目的依赖问题被很好的解决,
一次运行,到处运行。
if(!require(packrat)){install.packages("packrat")}
getOption("repos")#显示代码镜像源
packrat:: bundle()#打包当前环境并虚拟化
packrat:: unbundle(bundle="xxx.tar.gz",where=".")#加载已经打包过的环境
packrat::opts$local.repos("~/R")#设置本地repos为路径
packrat::install_local("pryr")#从本地安装
Hadley Wickham:Git与团队协作
教学视频地址
团队协作:利用Git和 GitHub,你可以很轻松的与人协作,你不再需要用邮件附件来备份文档,或者在Dropbox上为争夺编辑权限而争吵。相反,你可以独立工作,最后只需要合并你们的成果就可以。
版本控制: Git在我们制造重大错误时都允许我们回滚到之前的任意时间点。我们也可以回顾我们之前所做的一起历史记录,跟踪bug的形成过程。
Rstudio Server的安装和使用(附常见问题)
在本地使用Rstudio有很多的限制,不能够长时间跑程序,而服务器上能够满足R的很多条件,通过在服务器端安装Rstudio能够和本地一样使用Rstudio。服务器的Rstudio Server通过浏览器输入IP地址完成。
注意:我这里使用的是centos 7,需要服务器的root权限。
1.1 Rstudio Server
1.2创建配置文件
1.3在防火墙配置文件中添加8787端口
1.4检查Rstudio-server是否能够运行并启动服务
1.5打开本地的浏览器,输入IP:端口号,会出现输入用户名和密码的提示。这里的用户名和密码就是每个用户自己的用户名和密码。
需要根据上面的步骤,打开rstudio的服务以及对应的网络端口。
2.1 RStudio Server安装完成后,浏览器无法打开ip:8787登录页,显示无法访问。
2.2 Rstudio server"Unable to connect to service"。在输入用户名和密码后,rstudio没有能够加载出来,并包以上出错。
2.3 Rstudio服务重启的问题。
rstudio-server有三个命令可以管理rstudio的服务
rstudio-server在重启的过程中,经常会遇到端口占用的问题,报错 Address already in use。这个错误是因为原有的进程占用已经设置好的端口,解决的方法是关闭所有占用该端口的进程。解决方案可以参考 这个网址。
2.3.1查看端口占用情况,这里我们是默认的8787端口
2.3.2结束对应的进程。这里关闭所有LISTEN相关的进程
至此,问题解决。
3参考网址
3.1
3.2
3.3
如何在 CentOS 系统上安装 Rstudio-server
在 CentOS系统上安装 Rstudio-server对于服务器管理与使用提供了极大便利,以下步骤将详细介绍如何完成这一过程。
首先,确保在管理员账号下操作,或者个人账号具有管理员权限,以便安装 R语言。在 CentOS系统中安装 R语言,可以通过两种方式进行:自动安装(使用 yum)或手动编译安装。
对于自动安装(推荐),输入以下命令:或使用管理员授权账号安装,等待安装完成。
如果遇到 CentOS版本较低导致 R的版本过低影响使用的情况,可选择手动编译安装。下载所需的 R版本,如 R4.1,使用 wget或前往官网下载。下载后解压文件,并进入 R的安装目录执行编译命令。修改环境配置文件以包含 R的安装路径。完成安装后,使用命令进行保存退出。
接下来,安装 Rstudio-server。登录 Rstudio官网,在 Products选项卡中选择 Rstudio Server,根据系统版本选择对应的版本进行下载并安装。
安装完成后,进行必要的设置。通过查看安装路径并添加文件 rserver.conf和 rsession.conf,分别配置 Rstudio-server的相关参数。确保防火墙设置允许 Rstudio-server的端口 8787通过。
如果在运行 Rstudio-server时遇到问题,检查 SELinux设置。如果 SELinux设置为 enabled,尝试将其更改为 disabled或将 Rstudio-server添加至不受 SELinux约束的列表中。重启服务器以应用更改。
最后,安装一些必要的插件,以确保后续的使用以及 R包的安装顺利。通过浏览器访问服务器 IP地址:8787即可使用 Rstudio-server。推荐使用谷歌或火狐浏览器。
此过程确保了 CentOS系统上 Rstudio-server的稳定运行与高效使用,为数据科学团队提供了强大的支持。