mirror of https://github.com/alibaba/DataX.git
155 lines
4.5 KiB
Markdown
155 lines
4.5 KiB
Markdown
|
# DataX TDengineReader
|
|||
|
|
|||
|
## 1 快速介绍
|
|||
|
|
|||
|
TDengineReader 插件实现了 TDengine 读取数据的功能。
|
|||
|
|
|||
|
## 2 实现原理
|
|||
|
|
|||
|
TDengineReader 通过TDengine的JDBC driver查询获取数据。
|
|||
|
|
|||
|
## 3 功能说明
|
|||
|
|
|||
|
### 3.1 配置样例
|
|||
|
|
|||
|
```json
|
|||
|
{
|
|||
|
"job": {
|
|||
|
"content": [
|
|||
|
{
|
|||
|
"reader": {
|
|||
|
"name": "tdenginereader",
|
|||
|
"parameter": {
|
|||
|
"user": "root",
|
|||
|
"password": "taosdata",
|
|||
|
"connection": [
|
|||
|
{
|
|||
|
"table": [
|
|||
|
"meters"
|
|||
|
],
|
|||
|
"jdbcUrl": "jdbc:TAOS-RS://192.168.56.105:6041/test?timestampFormat=TIMESTAMP"
|
|||
|
}
|
|||
|
],
|
|||
|
"column": [
|
|||
|
"ts",
|
|||
|
"current",
|
|||
|
"voltage",
|
|||
|
"phase"
|
|||
|
],
|
|||
|
"beginDateTime": "2017-07-14 10:40:00",
|
|||
|
"endDateTime": "2017-08-14 10:40:00"
|
|||
|
}
|
|||
|
},
|
|||
|
"writer": {
|
|||
|
"name": "streamwriter",
|
|||
|
"parameter": {
|
|||
|
"encoding": "UTF-8",
|
|||
|
"print": true
|
|||
|
}
|
|||
|
}
|
|||
|
}
|
|||
|
],
|
|||
|
"setting": {
|
|||
|
"speed": {
|
|||
|
"channel": 1
|
|||
|
}
|
|||
|
}
|
|||
|
}
|
|||
|
}
|
|||
|
```
|
|||
|
|
|||
|
### 3.2 参数说明
|
|||
|
|
|||
|
* **username**
|
|||
|
* 描述:TDengine实例的用户名 <br />
|
|||
|
* 必选:是 <br />
|
|||
|
* 默认值:无 <br />
|
|||
|
* **password**
|
|||
|
* 描述:TDengine实例的密码 <br />
|
|||
|
* 必选:是 <br />
|
|||
|
* 默认值:无 <br />
|
|||
|
* **table**
|
|||
|
* 描述:所选取的需要同步的表。使用JSON的数组描述,因此支持多张表同时抽取。当配置为多张表时,用户自己需保证多张表是同一schema结构,
|
|||
|
TDengineReader不予检查表是否同一逻辑表。注意,table必须包含在connection配置单元中。<br />
|
|||
|
* 必选:是 <br />
|
|||
|
* 默认值:无 <br />
|
|||
|
* **jdbcUrl**
|
|||
|
* 描述:TDengine数据库的JDBC连接信息。注意,jdbcUrl必须包含在connection配置单元中。JdbcUrl具体请参看TDengine官方文档。
|
|||
|
* 必选:是 <br />
|
|||
|
* 默认值:无<br />
|
|||
|
* **beginDateTime**
|
|||
|
* 描述:数据的开始时间,Job迁移从begineDateTime到endDateTime的数据,格式为yyyy-MM-dd HH:mm:ss,如果不填为全量同步 <br />
|
|||
|
* 必选:否 <br />
|
|||
|
* 默认值:无 <br />
|
|||
|
* **endDateTime**
|
|||
|
* 描述:数据的结束时间,Job迁移从begineDateTime到endDateTime的数据,格式为yyyy-MM-dd HH:mm:ss,如果不填为全量同步 <br />
|
|||
|
* 必选:否 <br />
|
|||
|
* 默认值:无 <br />
|
|||
|
|
|||
|
### 3.3 类型转换
|
|||
|
| TDengine 数据类型 | DataX 内部类型 |
|
|||
|
| --------------- | ------------- |
|
|||
|
| TINYINT | Long |
|
|||
|
| SMALLINT | Long |
|
|||
|
| INTEGER | Long |
|
|||
|
| BIGINT | Long |
|
|||
|
| FLOAT | Double |
|
|||
|
| DOUBLE | Double |
|
|||
|
| BOOLEAN | Bool |
|
|||
|
| TIMESTAMP | Date |
|
|||
|
| BINARY | Bytes |
|
|||
|
| NCHAR | String |
|
|||
|
|
|||
|
## 4 性能报告
|
|||
|
|
|||
|
### 4.1 环境准备
|
|||
|
|
|||
|
#### 4.1.1 数据特征
|
|||
|
|
|||
|
建表语句:
|
|||
|
|
|||
|
单行记录类似于:
|
|||
|
|
|||
|
#### 4.1.2 机器参数
|
|||
|
|
|||
|
* 执行DataX的机器参数为:
|
|||
|
1. cpu:
|
|||
|
2. mem:
|
|||
|
3. net: 千兆双网卡
|
|||
|
4. disc: DataX 数据不落磁盘,不统计此项
|
|||
|
|
|||
|
* TDengine数据库机器参数为:
|
|||
|
1. cpu:
|
|||
|
2. mem:
|
|||
|
3. net: 千兆双网卡
|
|||
|
4. disc:
|
|||
|
|
|||
|
#### 4.1.3 DataX jvm 参数
|
|||
|
|
|||
|
-Xms1024m -Xmx1024m -XX:+HeapDumpOnOutOfMemoryError
|
|||
|
|
|||
|
### 4.2 测试报告
|
|||
|
|
|||
|
#### 4.2.1 单表测试报告
|
|||
|
|
|||
|
| 通道数| DataX速度(Rec/s)|DataX流量(MB/s)| DataX机器网卡流出流量(MB/s)|DataX机器运行负载|DB网卡进入流量(MB/s)|DB运行负载|DB TPS|
|
|||
|
|--------| --------|--------|--------|--------|--------|--------|--------|
|
|||
|
|1| | | | | | | |
|
|||
|
|4| | | | | | | |
|
|||
|
|8| | | | | | | |
|
|||
|
|16| | | | | | | |
|
|||
|
|32| | | | | | | |
|
|||
|
|
|||
|
说明:
|
|||
|
|
|||
|
1. 这里的单表,主键类型为 bigint(20),自增。
|
|||
|
2. batchSize 和 通道个数,对性能影响较大。
|
|||
|
|
|||
|
#### 4.2.4 性能测试小结
|
|||
|
|
|||
|
1.
|
|||
|
2.
|
|||
|
|
|||
|
## 5 约束限制
|
|||
|
|
|||
|
## FAQ
|