TẠP CHÍ KHOA HỌC 
Khoa học Tự nhiên và Công nghệ, Số 10 (9/2017) tr 47 - 54 
47 
XÁC ĐỊNH, XẾP LOẠI VÀ KHẢO SÁT SỰ BIỂU HIỆN 
CỦA CÁC GEN MÃ HÓA DEHYDRIN (DHN) 
Ở CÂY ĐẬU TƢƠNG (Glycine max (L.) Merr.) 
BẰNG PHÂN TÍCH IN SILICO 
Vũ Thị Nự, Nguyễn Thị Sơn, Hà Mạnh Linh6 
Trường Đại học Tây Bắc 
Tóm tắt: Bằng phân tích in silico, chúng tôi đã xác định được 11 gen mã hóa cho các protein Dehydrin 
(DHN) trong hệ gen của cây đậu tương. Các protein suy diễn của các gen này đều có mang trình tự bảo thủ đặc 
hiệu cho DHN là phân mảnh K đã được báo cáo ở nhiều loài. Phân tích cây phát sinh chủng loại cho thấy, các 
DHN của cây đậu tương nằm trên ba nhánh khác nhau, có một số hiện tượng nhân gen xảy ra sau quá trình biệt hóa 
loài. Kết quả phân tích RNAseq cho thấy có 7 trong 11 gen DHN biểu hiện ở ít nhất một loại mô của cây đậu tương, 
chỉ hai gen GmDHN1 và GmDHN9 biểu hiện ở tất cả các loại mô nghiên cứu, đồng thời hai gen này cũng biểu hiện 
mạnh hơn các gen khác ở hầu hết các mô. Hai gen GmDHN1 và GmDHN9 biểu hiện mạnh ở mô hoa, mô vỏ quả, rễ 
và biểu hiện yếu hơn ở mô hạt, lá non và nốt sần. Gen GmDHN6 và GmDHN8, biểu hiện mạnh hơn so với các gen 
còn lại ở hạt trong giai đoạn phát triển muộn, các gen GmDHN2, GmDHN3, GmDHN5 và GmDHN11 không biểu 
hiện ở các loại mô được nghiên cứu. 
Từ khóa: Biểu hiện gen, cây di truyền, Dehydrin (DHN), đậu tương. 
1. Mở đầu 
Cây đậu tương (Glycine max (L.) Merr) là một trong những cây trồng quan trọng, có 
lịch sử trồng trọt lâu đời, được trồng ở nhiều nước trên thế giới từ châu Âu, châu Á, châu Phi, 
châu Mỹ, nhất là ở vùng nhiệt đới và á nhiệt đới. Hạt đậu tương là loại sản phẩm có giá trị 
đồng thời cả về protein và lipit [3]. Thành phần dinh dưỡng trong hạt đậu tương rất cao, với 
hàm lượng protein từ 38 - 40%, lipit từ 15 - 20%, hyđratcacbon từ 15 - 16% và muối khoáng 
quan trọng cho sự sống. Ở nước ta, trong những thập niên gần đây diện tích trồng đậu tương 
không ngừng tăng lên [9]. Nhờ giá trị cao, hệ gen của đậu tương đã được giải trình tự vào 
năm 2010 bởi tập thể các nhà khoa học dẫn đầu bởi G. Stacey, R. Shoemaker, S. Jackson, J. 
Schmutz, và D. Rokhsar. Phiên bản hệ gen của cây đậu tương hiện có kích thước xấp xỉ 975 
Mb, gồm có 20 nhiễm sắc thể [15]. Đối với một loài sinh vật có hệ gen được giải trình tự, việc 
nghiên cứu về cấu trúc và chức năng hệ gen (genomics) có ý nghĩa rất quan trọng. Ở Việt 
Nam, có nhiều nguyên nhân làm giảm diện tích cũng như năng suất đậu tương như ánh sáng, 
độ ẩm, nhiệt độ, kĩ thuật, mùa vụ, hạn hán, đặc điểm di truyền của các giống. Trong đó, hạn 
hán là nguyên nhân chủ yếu làm giảm diện tích và năng suất của đậu tương do đó việc xác 
định và nghiên cứu sự biểu hiện của các gen liên quan đến tính chịu hạn của cây đậu tương là 
việc làm cần thiết. 
Dehydrin (DHN) là một họ bao gồm nhiều loại protein có số lượng lớn trong giai đoạn 
phát triển phôi muộn, đóng vai trò quan trọng trong khả năng thích nghi của thực vật với các 
điều kiện bất lợi [5, 8]. DHN gồm các protein được xếp vào nhóm II (LEA2-D11) của họ Late 
6 Ngày nhận bài: 03/01/2017. Ngày nhận kết quả phản biện: 10/5/2017. Ngày nhận đăng: 20/9/2017 
Liên lạc: Vũ Thị Nự, e - mail: 
[email protected] 
 48 
Embryogenesis Abundant protein (LEA) [5]. Các DHN được xác định đều có ái lực cao với 
nước, tính chất này giúp chúng giữ được nước ngay cả trong điều kiện tế bào mất nước mạnh. 
DHN bền với nhiệt và có thể giữ nguyên vẹn cấu trúc không bị thay đổi trong dung dịch nước ở 
nhiệt độ đến 100C, nhóm này có 3 đoạn bảo thủ kí hiệu là Y, S, K [5, 8]. Dựa vào cấu trúc 
DHN được chia thành 6 nhóm: Kn, SKn, KnS, YnKn và YnSKn và SKS [11]. DHN phân bố trong 
nhiều mô tế bào ở nhiều giai đoạn phát triển khác nhau: Mô sinh dưỡng và mô sinh thực. Một 
số DHN như protein RAB18 của Arabidopsis và RAB (response to abscisic acid) của ngô tìm 
thấy trong hạt; ở hầu hết các mô của mầm và lá mầm [8]. Trong tế bào, DHN được phát hiện ở 
tế bào chất, nhân, màng tế bào và ty thể. Phần lớn các DHN được tìm thấy trong cây khi bị tác 
động của điều kiện bất lợi, tác động của abscisic acid (ABA), hạn, lạnh, độ mặn cao [10]. Hiện 
nay, đã có hơn 800 trình tự gen DHN đã được phân lập và hơn 700 trình tự protein DHN đã 
được xác định từ nhiều loài thực vật khác nhau (hạt kín, hạt trần và thực vật bậc thấp) [8]. Trên 
cây đậu tương, một số gen DHN cũng đã được tách dòng và xác định trình tự [12, 18]. Trong 
nghiên cứu này, bài báo sử dụng phương pháp In Silico để xác định trình tự của các DHN trong 
hệ gen của cây đậu tương, xây dựng cây phát sinh chủng loại và phân loại các DHN, đồng thời 
khảo sát sự biểu hiện của các gen DHN ở loài cây này. 
2. Vật liệu và phƣơng pháp nghiên cứu 
2.1. Cơ sở dữ liệu về các trình tự hệ gen và RNAseq ở cây đậu tương 
Các trình tự được khai thác từ cơ sở dữ liệu trên ngân hàng gen (NCBI). Trong đó, trình 
tự hệ gen của cây đậu tương theo công bố của Schmutz và cs. (2010), dữ liệu RNAseq theo 
Severin và cs. (2010), các trình tự DHN của cây Arabidopsis theo Hundertmark và Hincha 
(2008) [6, 15, 16]. 
2.2. Xác định các gen thuộc họ DHN ở cây đậu tương 
Mười protein DHN của cây Arabidopsisthaliana (AT1G20440, AT1G20450, 
AT1G54410, AT1G76180, AT2G21490, AT3G50970, AT3G50980, AT4G38410, 
AT4G39130, AT5G66400) [6] được dùng làm khuôn dò để tìm kiếm các gen tương đồng trên 
dữ liệu nucleotide của toàn hệ gen của cây đậu tương nhờ chương trình TBLASTN theo Cao 
Phi Bằng và Trần Thị Thanh Huyền (2015) [1]. 
2.3. Các đặc điểm hóa - lí 
Các đặc điểm vật lí, hóa học của các gen/protein nghiên cứu được khảo sát nhờ các 
công cụ của ExPASy (Expert Protein Analysis System) [3]. 
2.4. Xây dựng cây phả hệ 
Cây phả hệ được xây dựng từ các trình tự protein nghiên cứu của các loài Arabidopsis, 
dương và quýt đường đã được sắp xếp nhờ phần mềm MEGA5 bằng sử dụng phương pháp 
Maximum Likelihood và tuân theo các tham biến: mẫu Jones-Taylor-Thornton (JTT), dữ liệu 
được xử lí là tất cả các vị trí và phương pháp Bootstrap với 1.000 lần lặp lại [17]. 
 49 
2.5. Khảo sát sự biểu hiện gen 
Bảng 1. Đặc điểm gen dehydrin của cây đậu tƣơng 
Gen Tên locus 
Chiều dài 
gen/ đoạn 
mã hóa 
Kích thước 
protein 
 suy diễn 
(aa) 
Khối lượng 
phân tử 
protein 
 suy diễn (KD) 
Chỉ số 
ưa nước 
Chỉ số 
béo 
pI 
Số 
itron 
GmDHN1 Glyma04g01130 1375/645 214 24,16 -1,509 50,09 5,53 1 
GmDHN2 Glyma04g01181 657/501 166 17,32 -0,971 51,81 9,22 1 
GmDHN3 Glyma06g01171 540/400 132 13,34 -1,36 51,17 5,22 2 
GmDHN4 Glyma07g10030 1730/732 243 26,55 -1,211 39,58 6,18 2 
GmDHN5 Glyma08g05361 276/276 91 9,90 -1,062 55,71 6,64 0 
GmDHN6 Glyma09g31740 1218/762 253 26,63 -1,244 27,79 6,29 2 
GmDHN7 Glyma12g36430 1650/408 135 14,69 -1,066 62,15 5,54 1 
GmDHN8 Glyma13g27120 1815/420 139 15,13 -1,186 51,22 5,52 1 
GmDHN9 Glyma16g04190 1406/339 112 12,59 -1,874 31,34 6,24 1 
GmDHN10 Glyma16g04200 1351/255 84 9,44 -1,942 32,50 6,21 1 
GmDHN11 Glyma17g24193 3231/498 165 18,89 -1,623 46,06 6,92 2 
Sự biểu hiện của các gen được phân tích thông qua ngân hàng RNAseq của cây đậu 
tương được xây dựng bởi Severin và cs. (2010) [16]. Các gen được khảo sát bằng cách đếm số 
lượng trình tự biểu hiện trong các cơ sở dữ liệu tồn tại trên trang web NCBI nhờ chương trình 
TBLASTN [1]. 
3. Kết quả và thảo luận 
3.1. Số lượng và đặc điểm các gen dehydrin của cây đậu tương 
Sử dụng mười protein dehydrin của cây Arabidopsis thaliana làm khuôn dò, đã tìm thấy 
tổng số 11 gen mã hóa cho các dehydrin ở trong toàn bộ hệ gen của cây đậu tương. Các locus 
gen tìm được tương ứng với các protein khuôn dò như sau: Protein AT1G20440 tìm được 4 
gen (Glyma09g31740, Glyma06g01171, Glyma04g01181 và Glyma04g01130); AT1G20450 
tìm được 1 gen (Glyma16g04190); AT1G54410 tìm được 2 gen (Glyma17g24193 và 
Glyma16g04200); AT1G76180 tìm được 4 gen (Glyma12g36430, Glyma13g27120, 
Glyma08g05361 và Glyma07g10030); các protein còn lại không tìm được gen tương ứng. 
Phân tích cấu trúc bậc một suy diễn các protein DHN của cây đậu tương, cho thấy các 
protein này đều mang các vùng bảo thủ đặc hiệu (Hình 1) cho các DHN đã được báo cáo ở 
nhiều loài khác là phân mảnh K. 
Các gen DHN của cây đậu tương có độ dài từ 276 tới 3231 nucleotide, kích thước của 
trình tự mã hóa của các gen là từ 255 đến 762 nucleotide. Trình tự các protein suy diễn có 
kích thước từ 84 tới 253 amino acid, tương ứng với khối lượng phân tử từ 9,44 KD tới 26,63 
 50 
KD. Hầu hết các dehydrin của cây đậu tương đều có tính axit yếu, pI của các protein này nằm 
trong khoảng 5,22 tới 6,92. Riêng GmDHN2 có tính bazơ, pI bằng 9,22 (Bảng 1). Các DHN 
cây đậu tương có tính ưa nước tương đối cao, chỉ số ưa nước từ -0,971 đến -1,942 trong đó 
cao nhất là GmDHN10. Tính ưa nước của các DHN ở cây đậu tương cũng tương đương với 
tính ưa nước của các DHN của cây quýt đường (Citrus clementina) đã được báo cáo [2]. Các 
gen này có chỉ số béo khác nhau dao động từ 31,34 đến 62,15 cao hơn so với các DHN ở cây 
quýt đường (Citrus clementina) [2]. 
Hình 1. Kết quả sắp dãy các protein DHN của cây đậu tƣơng 
Ghi chú: Dấu  đánh dấu các amino acid bảo thủ, các kí tự được đóng khung thể hiện vùng bảo thủ. 
 51 
3.2. Phân tích cây phả hệ 
Cây phả hệ được xây dựng từ các DHN của cây đậu tương và các loài cây khác 
(Arabidopsis, dương, quýt) được thể hiện ở Hình 2. 
Hình 2. Cây phả hệ đƣợc xây dựng từ các DHN của các loài A.thaliana (At), 
đậu tƣơng (Gm), dƣơng (Ptr) và quýt (Ccl) 
Các DHN của cây đậu tương nằm trên ba nhánh khác nhau. Nhánh thứ nhất gồm 
GmDHN2, GmDHN7 và GmDHN8. Ba trình tự này nằm trên cùng nhánh với PtrDHN2 và 
PtrDHN8 của cây dương. Hai trình tự này của cây dương được xếp vào nhóm YnSKn hay 
 52 
nhóm II. Kết quả này hoàn toàn phù hợp với kết quả phân tích trình tự các DHN của cây đậu 
tương bằng cách xếp dòng. Trong ba protein GmDHN2, GmDHN7 và GmDHN8 có mang hai 
motif Y, một motif S và hai motif K. Ba trình tự GmDHN4, GmDHN5 và GmDHN6 là các 
protein tương đồng của các DHN kiểu YnSKn. 
Nhánh thứ hai chỉ có hai gen GmDHN1 và GmDHN3. Trong cấu trúc protein suy diễn 
của hai gen này có tồn tại một motif S và nhiều motif K. Ba gen còn lại nằm trên nhánh có 
nhiều DHN kiểu KnS. 
Cây phả hệ cho thể thấy ở cây đậu tương có một số hiện tượng nhân gen xảy ra sau quá 
trình biệt hóa loài. 
3.3. Khảo sát sự biểu hiện gen 
Bảng 2. Sự biểu hiện của các gen dehydrin ở cây đậu tƣơng (đơn vị tính RPKM = số bản mã 
phiên (ARN)/1000 nucleotide của mã phiên/một triệu bản mã phiên) 
Chú thích: (DAF = Day after fertilization = ngày sau thụ tinh) 
Phân tích kết quả RNAseq cho thấy có 7 trong 11 gen DHN biểu hiện ở ít nhất một loại 
mô của cây đậu tương. Trong đó, hai gen GmDHN1 và GMDHN9 biểu hiện ở tất cả các loại 
mô nghiên cứu với mức độ mạnh hơn các gen khác (Bảng 2). Hai gen GmDHN1 và 
GmDHN9 biểu hiện mạnh ở mô hoa, mô vỏ quả, rễ và biểu hiện yếu hơn ở mô hạt, lá non và 
nốt sần. Gen GmDHN6 và GmDHN8, biểu hiện mạnh hơn so với các gen còn lại ở hạt trong 
giai đoạn phát triển muộn. Các gen còn lại (GmDHN4, GmDHN7, GmDHN10) biểu hiện rất 
yếu ở một số mô, một số mô thì không biểu hiện. 
Bốn gen GmDHN2, GmDHN3, GmDHN5 và GmDHN11 hoàn toàn không được biểu 
hiện ở các loại mô trong giai đoạn nghiên cứu. 
 53 
4. Kết luận 
Trong nghiên cứu này, nhóm tác giả đã sử dụng phương pháp in silico để xác định được 
11 gen mã hóa cho Dehydrin trong cây đậu tương. Kết quả phân tích in silico các protein này 
cho thấy, các protein này đều mang các vùng bảo thủ đặc hiệu quan trọng. Các DHN của cây 
đậu tương có có độ dài từ 276 tới 3231 nucleotit, kích thước của trình tự mã hóa của các gen từ 
255 đến 825 nucleotide. Các dehydrin của cây đậu tương phần lớn đều có tính axit yếu, riêng 
GmDHN2 có tính bazơ. Các DHN cây đậu tương có tính ưa nước cao, chỉ số ưa nước dao động 
từ -0,971 đến -1,942. Các gen này cũng có chỉ số béo khác nhau dao động từ 31,34 đến 62,15. 
Các gen DHN của cây đậu tương xếp trên ba nhánh khác nhau thể hiện đã có sự nhân gen mạnh 
xảy ra sau quá trình biệt hóa loài. Trong số các DHN được tìm thấy, có 7 trong số 11 gen có 
biểu hiện ít nhất ở một loại mô. Tuy nhiên các gen này cũng có cường độ biểu hiện khác nhau ở 
các loại mô khác nhau. Các kết quả nghiên cứu này cung cấp những thông tin quan trọng về đặc 
điểm, sự biểu hiện của họ gen liên quan đến các protein chống mất nước, có vai trò quan trọng 
trong khả năng đáp ứng của cây đậu tương với điều kiện bất lợi. 
TÀI LIỆU THAM KHẢO 
[1] Cao Phi Bằng, Trần Thị Thanh Huyền (2015). Phân tích họ gen -amylase ở cây đậu 
tương (Glycine max), Tạp chí Sinh học, 37(1se): 165-176. 
[2] Cao Phi Bằng (2014). Đặc trưng hóa và khảo sát sự biểu hiện của họ gen dehydrin ở cây 
quýt đường (Citrus clementina). Tạp chí Khoa học và Phát triển, 12(7): 1134-1139. 
[3] Friedman M., Brandon D. L. (2001). Nutritional and health benefits of soy proteins. J. 
Agric Food Chem., 49(3): 1069-1086. 
[4] Gasteiger E., Hoogland C., Gattiker A., Wilkins M. R., Appel R. D., Bairoch A. (2005). 
Protein identification and analysis tools on the ExPASy server. The proteomics 
protocols handbook, Springer: 571-607. 
[5] Hanin M., Brini F., Ebel C., Toda Y., Takeda S. and Masmoudi K. (2011). Plant 
dehydrins and stress tolerance: versatile proteins for complex mechanisms, Plant 
Signaling & Behavior, 6(10): 1503-1509. 
[6] Hundertmark M. and Hincha D. K. (2008). LEA (late embryogenesis abundant) proteins 
and their encoding genes in Arabidopsis thaliana, BMC genomics, 9(1): p. 118. 
[7] Liu K. (2005), Soybeans as functional foods and ingredients, AOCS Publishing, p. 311. 
[8] Trần Thị Phương Liên, Vũ Hoài Thu, Bùi Mạnh Cường (2007). Sự đa dạng của gen 
Dehydrin của một số giống ngô Việt Nam, Tạp chí Công nghệ sinh học, 5(4): 485-491. 
[9] Trần Thị Phương Liên, Nông Văn Hải (2008). Dehydrin - protein chống mất nước ở 
thực vật, Tạp chí công nghệ sinh học, 6 (2): 133-143. 
[10] Trần Thị Phương Liên (2010). Protein và tính chống chịu của thực vật. Nhà xuất bản 
Khoa học tự nhiên và Công nghệ, Hà Nội, tr. 180-188. 
[11] Liu C. C., Li C. M., Liu B. G., et al. (2012). Genome-wide identification and 
characterization of a Dehydrin gene family in Poplar (Populus trichocarpa), Plant. Mol. 
Biol. Rep., 30(4): 848-859. 
 54 
[12] Chu Hoàng Mậu, Nguyễn Thu Hiền (2007). Đánh giá khả năng chịu hạn và tách dòng 
gen mã hóa protein dehydrin (LEA-D11) của một số giống đậu tương (Glycine max L. 
Merrill) địa phương miền núi, Tạp chí Sinh học, 29(4): 31-41. 
[13] Morse W. J. (1950). History of soybean production, In: Markley, K.s, soybean and 
soybean products, Vol. Đ. Interscience Publishrs, Inc, New York London, pp. 5-50. 
[14] Ricke, P.L & Morse, M.J. (1948). The correct botanical name for the soybean, Jour. 
Amer. Soc. Agron., (40): 190-191. 
[15] Schmutz J., Cannon S. B., Schlueter J., Ma J., Mitros T., Nelson W., Hyten D. L., Song 
Q., Thelen J. J., Cheng J., Xu D., Hellsten U., May G. D., Yu Y., Sakurai T., Umezawa 
T, Bhattacharyya MK, Sandhu D, Valliyodan B, Lindquist E, Peto M, Grant D, Shu S, 
Goodstein D., Barry K., Libault M., Sethuraman A., Zhang X. C., Shinozaki K., 
Nguyen H. T., Wing R. A., Cregan P., Specht J., Grimwood J., Rokhsar D., Stacey G., 
Shoemaker R. C., Jackson S. A., (2010). Genome sequence of the palaeopolyploid 
soybean, Nature, 463(7278): 178-183. 
[16] Severin A. J., Woody J. L., Bolon Y. T., Joseph B., Diers B. W., Farmer A. D., 
Muehlbauer G. J., Nelson R. T., Grant D., Specht J. E., Graham M. A., Cannon S. B., 
May G. D., Vance C. P., Shoemaker R. C. (2010). RNA-Seq Atlas of Glycine max: a 
guide to the soybean transcriptome, BMC Plant Biol. 10: p. 160. 
[17] Tamura K., Peterson D., Peterson N., Stecher G., Nei M., Kumar S. (2011). MEGA5: 
molecular evolutionary genetics analysis using maximum likelihood, evolutionary 
distance, and maximum parsimony methods, Mol. Biol. Evol., 28(10): 2731-2739. 
[18] Phạm Văn Thiều (2006). Cây đậu tương - Kỹ thuật trồng và chế biến sản phẩm. Nhà 
xuất bản Nông Nghiệp, Hà Nội, tr. 5-35. 
IDENTIFICATION, CLASSIFICATION AND EXPRESSION SURVEY 
OF DEHYDRIN GENES IN SOYBEAN (Glycine max (L.) Merr.) 
BY IN SILICO METHODS 
Vu Thi Nu, Nguyen Thi Son, Ha Manh Linh 
Tay Bac University 
Abstract: By using in silico methods, the article has identified 11 genes coding for proteins DHN in the 
whole genome of soybean. These proteins contained the conserved sequences specific to DHN were fragmented 
K, which were reported in many species. Analysis of the phylogenetic tree showed that the DHNs of soybean 
were positioned on three different branches, and some duplication events occurred after the speciation. The 
results of RNAseq analysis showed that seven of eleven DHN genes were expressed in at least one type of tissue. 
Only two genes GmDHN1 and GmDHN9 were expressed in all studied tissues, and they also were expressed 
stronger than the others in almost tissues. The expression of two genes GmDHN1 and GmDHN9 were strong in 
flower tissue, pod, root and weaker expression in seed, young leaf and nodule. While the expression of GmDHN6 
and GmDHN8 were stronger than the other genes in seed at late stage development, gens GmDHN2, GmDHN3, 
GmDHN5 and GmDHN11 were not expressed in the tissues in this study. 
Keywords: Dehydrin (DHN), soybean, gene expression, phylogenetic tree.