0%

How to deploy doccano on my new server

本文介绍一下如何购买一台小服务器,并且以部署标注工具doccano为案例进行实操,包括如下内容

  • 服务器选购建议
  • 服务器的基本配置
    • 防火墙
  • 如何部署doccano
    • 安装docker
    • 安装并启动doccano

选购服务器

一般用腾讯或者阿里云的轻量云服务器,最底层的配置是1核2G内存,学生特价能做到10元每月左右,我自己主力是使用腾讯云,下文以腾讯云为例。

选购服务器的时候一般会让选择“镜像”,也就是我们所谓的操作系统,建议选择ubuntu最新版本(目前是ubuntu22.04),因为它的使用量大,网上教程好找。

配置服务器

拿到新的服务器之后,首先从腾讯云等供应商的控制台获得登陆密码,建议获得密码之后配置ssh免密码登录。

到这里服务器基本就能用了,还差一件事,打开端口(腾讯云叫:安全组),入口如下图。

安全组入口

简单解释一下原理,外界(包括你自己,包括黑客)通过网络访问机器时需要通过IP地址和端口(Port)来定位,为了安全起见,腾讯云默认一般只放通最常用的端口,比如SSH用的22(如果你把22关掉那一般就不能通过SSH来连接机器了,因为SSH默认是22)。但是如果你想要开放标注工具等自建网站,就需要把这个网站使用的端口也开放一下。

所以怎么修改安全组呢?进入上面的安全组管理界面后,找到服务器正在使用的安全组,在入站规则里面进行“添加规则”,比如如果我要开放5000端口(后文案例开放的是8000,记得改一下),就这样添加:

入站规则

然后外部网络就可以访问5000这个端口了。

安装Docker

下面就是关于如何让这台服务器干活,我们以安装doccano标注系统为例

首先安装docker,以docker官网教程为主,可以参考2022年春分布式计算课程中的讲义,最后记得测试一下是不是装好了

1
2
3
4
docker run hello-world

# 如果报错的话,运行一下命令后,重试(其中<username>是你的用户名,比如ubuntu)
sudo usermod -aG docker <username>

这个过程可能比较久,如果碰到问题不要着急,尽量先确定问题原因(版本问题?网络问题?),然后搜办法,或者去腾讯云控制台把机器重装一下,从头来过。如果网络不太给力,可以参考一下这个教程(我是用了代理,但是比较麻烦,可以试试修改docker为国内源)

部署Doccano

装好docker就可以部署doccano了,两个个命令就行了,注意里面有很多可以自定义的选项,比如 admin@example.compassword。启动容器后就可以直接根据IP地址:8000来访问了。

1
2
3
4
5
6
7
8
9
10
11
12
docker pull doccano/doccano

# 创建一个名为doccano(可以随便改)的容器,基于doccano/doccano
docker container create --name doccano \
-e "ADMIN_USERNAME=admin" \
-e "ADMIN_EMAIL=admin@example.com" \
-e "ADMIN_PASSWORD=password" \
-v doccano-db:/data \
-p 8000:8000 doccano/doccano

# 启动名为doccano的容器(上一条命了--name指定的名字)
docker start doccano

Docker 操作还是比较复杂的,建议简单学一学,不要一不小心把容器删掉,那标注数据就全没了(一定要及时备份!)。

完结撒花!

完结