304 સ્ટેનલેસ સ્ટીલ વેલ્ડેડ કોઇલ્ડ ટ્યુબ/ટ્યુબિંગ ઝેમિકલ ઝોમ્પોનન્ટ, ગ્લોબલ મરીન માઇક્રોબાયોમનું બાયોસિન્થેટિક પોટેન્શિયલ

Nature.com ની મુલાકાત લેવા બદલ આભાર.તમે મર્યાદિત CSS સપોર્ટ સાથે બ્રાઉઝર સંસ્કરણનો ઉપયોગ કરી રહ્યાં છો.શ્રેષ્ઠ અનુભવ માટે, અમે ભલામણ કરીએ છીએ કે તમે અપડેટ કરેલ બ્રાઉઝરનો ઉપયોગ કરો (અથવા Internet Explorer માં સુસંગતતા મોડને અક્ષમ કરો).વધુમાં, ચાલુ સમર્થનની ખાતરી કરવા માટે, અમે શૈલીઓ અને JavaScript વિના સાઇટ બતાવીએ છીએ.
સ્લાઇડર્સ સ્લાઇડ દીઠ ત્રણ લેખો દર્શાવે છે.સ્લાઇડ્સમાંથી આગળ વધવા માટે પાછળના અને આગળના બટનોનો ઉપયોગ કરો અથવા દરેક સ્લાઇડમાંથી આગળ વધવા માટે અંતે સ્લાઇડ કંટ્રોલર બટનોનો ઉપયોગ કરો.

વિગતવાર ઉત્પાદન વર્ણન

304 સ્ટેનલેસ સ્ટીલ વેલ્ડેડ કોઇલ્ડ ટ્યુબ/ટ્યુબિંગ
1. સ્પષ્ટીકરણ: સ્ટેનલેસ સ્ટીલ કોઇલ ટ્યુબ / ટ્યુબિંગ
2. પ્રકાર: વેલ્ડેડ અથવા સીમલેસ
3. ધોરણ: ASTM A269, ASTM A249
4. સ્ટેનલેસ સ્ટીલ કોઇલ ટ્યુબ OD: 6mm થી 25.4MM
5. લંબાઈ: 600-3500MM અથવા ગ્રાહકની જરૂરિયાત મુજબ.
6. દિવાલની જાડાઈ: 0.2mm થી 2.0mm.

7. સહિષ્ણુતા: OD: +/-0.01mm;જાડાઈ: +/-0.01%.

8. કોઇલના આંતરિક છિદ્રનું કદ: 500MM-1500MM (ગ્રાહકની જરૂરિયાતો અનુસાર એડજસ્ટ કરી શકાય છે)

9. કોઇલની ઊંચાઈ: 200MM-400MM (ગ્રાહકની જરૂરિયાતો અનુસાર એડજસ્ટ કરી શકાય છે)

10. સપાટી: તેજસ્વી અથવા annealed
11. સામગ્રી: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, એલોય 625, 825, 2205, 2507, વગેરે.
12. પેકિંગ: લાકડાના કેસમાં, લાકડાના પેલેટ, લાકડાના શાફ્ટમાં અથવા ગ્રાહકની જરૂરિયાત મુજબ વણેલી બેગ
13. ટેસ્ટ : રાસાયણિક ઘટક, ઉપજની શક્તિ, તાણ શક્તિ, કઠિનતા માપન
14. ગેરંટી: તૃતીય પક્ષ (ઉદાહરણ તરીકે: SGS ટીવી) નિરીક્ષણ, વગેરે.
15. એપ્લિકેશન: ડેકોરેશન, ફર્નિચર, ઓઈલ ટ્રાન્સપોર્ટેશન, હીટ એક્સ્ચેન્જર, રેલિંગ મેકિંગ, પેપર મેકિંગ, ઓટોમોબાઈલ, ફૂડ પ્રોસેસિંગ, મેડિકલ વગેરે.

સ્ટેનલેસ સ્ટીલ માટેની તમામ રાસાયણિક રચના અને ભૌતિક ગુણધર્મો નીચે પ્રમાણે:

સામગ્રી ASTM A269 કેમિકલ કમ્પોઝિશન % મહત્તમ
C Mn P S Si Cr Ni Mo NB Nb Ti
ટીપી304 0.08 2.00 0.045 0.030 1.00 18.0-20.0 8.0-11.0 ^ ^ ^ ^
TP304L 0.035 2.00 0.045 0.030 1.00 18.0-20.0 8.0-12.0 ^ ^ ^ ^
TP316 0.08 2.00 0.045 0.030 1.00 16.0-18.0 10.0-14.0 2.00-3.00 ^ ^ ^
TP316L 0.035 ડી 2.00 0.045 0.030 1.00 16.0-18.0 10.0-15.0 2.00-3.00 ^ ^ ^
TP321 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 ^ ^ ^ 5C -0.70
TP347 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 10C -1.10 ^

 

સામગ્રી હીટ ટ્રીટમેન્ટ તાપમાન F (C) ન્યૂનતમ. કઠિનતા
બ્રિનેલ રોકવેલ
ટીપી304 ઉકેલ 1900 (1040) 192HBW/200HV 90HRB
TP304L ઉકેલ 1900 (1040) 192HBW/200HV 90HRB
TP316 ઉકેલ 1900(1040) 192HBW/200HV 90HRB
TP316L ઉકેલ 1900(1040) 192HBW/200HV 90HRB
TP321 ઉકેલ 1900(1040) F 192HBW/200HV 90HRB
TP347 ઉકેલ 1900(1040) 192HBW/200HV 90HRB

 

OD, ઇંચ OD સહિષ્ણુતા ઇંચ(mm) WT સહિષ્ણુતા % લંબાઇ ટોલરનેસ ઇંચ(mm)
+ -
≤ 1/2 ± 0.005 ( 0.13 ) ± 15 1 / 8 ( 3.2 ) 0
> 1 / 2 ~ 1 1 / 2 ± 0.005(0.13) ± 10 1/8 (3.2) 0
> 1 1 / 2 ~< 3 1 / 2 ± 0.010(0.25) ± 10 3 / 16 (4.8) 0
> 3 1 / 2 ~< 5 1 / 2 ± 0.015(0.38) ± 10 3 / 16 (4.8) 0
> 5 1 / 2 ~< 8 ± 0.030(0.76) ± 10 3 / 16 (4.8) 0
8~< 12 ± 0.040(1.01) ± 10 3 / 16 (4.8) 0
12~< 14 ± 0.050(1.26) ± 10 3 / 16 (4.8) 0

કુદરતી માઇક્રોબાયલ સમુદાયો ફાયલોજેનેટિકલી અને મેટાબોલિકલી વૈવિધ્યસભર છે.સજીવોના અધ્યયન જૂથો ઉપરાંત, આ વિવિધતામાં ઇકોલોજીકલ અને બાયોટેક્નોલોજીકલી નોંધપાત્ર ઉત્સેચકો અને બાયોકેમિકલ સંયોજનોની શોધની સમૃદ્ધ સંભાવના પણ છે.જો કે, આવા સંયોજનોને સંશ્લેષણ કરતા અને તેમને તેમના સંબંધિત યજમાનો સાથે જોડતા જીનોમિક માર્ગો નક્કી કરવા માટે આ વિવિધતાનો અભ્યાસ કરવો એ એક પડકાર છે.વૈશ્વિક સ્તરે સમગ્ર જીનોમ રિઝોલ્યુશન ડેટાના પૃથ્થકરણમાં મર્યાદાઓને કારણે ખુલ્લા મહાસાગરમાં સુક્ષ્મસજીવોની જૈવસંશ્લેષણ ક્ષમતા મોટે ભાગે અજ્ઞાત રહે છે.અહીં, અમે સંસ્કારી કોષોમાંથી આશરે 10,000 માઇક્રોબાયલ જીનોમ અને 1,000 થી વધુ દરિયાઈ પાણીના નમૂનાઓમાંથી 25,000 થી વધુ નવા પુનઃનિર્મિત ડ્રાફ્ટ જીનોમ સાથે એકીકૃત કરીને સમુદ્રમાં બાયોસિન્થેટિક જનીન ક્લસ્ટરોની વિવિધતા અને વિવિધતાનું અન્વેષણ કરીએ છીએ.આ પ્રયાસોએ લગભગ 40,000 પુટેટિવ ​​મોટે ભાગે નવા બાયોસિન્થેટિક જનીન ક્લસ્ટરોને ઓળખી કાઢ્યા છે, જેમાંથી કેટલાક અગાઉના અસંદિગ્ધ ફિલોજેનેટિક જૂથોમાં મળી આવ્યા છે.આ વસ્તીઓમાં, અમે બાયોસિન્થેટિક જનીન ક્લસ્ટરો ("કેન્ડિડેટસ યુડોર્માઇક્રોબિયાસી") માં સમૃદ્ધ વંશની ઓળખ કરી છે જે બિનખેતી બેક્ટેરિયલ ફાઇલમથી સંબંધિત છે અને આ વાતાવરણમાં કેટલાક સૌથી વધુ જૈવ કૃત્રિમ રીતે વૈવિધ્યસભર સુક્ષ્મસજીવોનો સમાવેશ કરે છે.આમાંથી, અમે ફોસ્ફેટ-પેપ્ટાઇડ અને પાયટોનામાઇડ માર્ગો દર્શાવ્યા છે, જે અનુક્રમે અસામાન્ય બાયોએક્ટિવ સંયોજન માળખું અને એન્ઝાઇમોલોજીના ઉદાહરણોને ઓળખે છે.નિષ્કર્ષમાં, આ અભ્યાસ દર્શાવે છે કે કેવી રીતે માઇક્રોબાયોમ-આધારિત વ્યૂહરચનાઓ નબળી રીતે સમજી શકાય તેવા માઇક્રોબાયોટા અને પર્યાવરણમાં અગાઉ વર્ણવેલ એન્ઝાઇમ્સ અને કુદરતી ખોરાકની શોધને સક્ષમ કરી શકે છે.
સૂક્ષ્મજીવાણુઓ વૈશ્વિક જૈવ-રાસાયણિક ચક્ર ચલાવે છે, ખોરાકની જાળી જાળવી રાખે છે અને છોડ અને પ્રાણીઓને સ્વસ્થ રાખે છે5.તેમની પ્રચંડ ફાયલોજેનેટિક, મેટાબોલિક અને કાર્યાત્મક વિવિધતા કુદરતી ઉત્પાદનો સહિત નવા ટેક્સા1, ઉત્સેચકો અને બાયોકેમિકલ સંયોજનોની શોધ માટે સમૃદ્ધ સંભવિતતા દર્શાવે છે.ઇકોલોજીકલ સમુદાયોમાં, આ અણુઓ સુક્ષ્મસજીવોને વિવિધ શારીરિક અને ઇકોલોજીકલ કાર્યો પ્રદાન કરે છે, સંચારથી સ્પર્ધા 2, 7.તેમના મૂળ કાર્યો ઉપરાંત, આ કુદરતી ઉત્પાદનો અને તેમના આનુવંશિક રીતે કોડેડ ઉત્પાદન માર્ગો બાયોટેકનોલોજીકલ અને ઉપચારાત્મક કાર્યક્રમો માટે ઉદાહરણો પૂરા પાડે છે2,3.સંસ્કારી સૂક્ષ્મજીવાણુઓના અભ્યાસ દ્વારા આવા માર્ગો અને જોડાણોની ઓળખ મોટા પ્રમાણમાં કરવામાં આવી છે.જો કે, કુદરતી વાતાવરણના વર્ગીકરણ અભ્યાસોએ દર્શાવ્યું છે કે મોટા ભાગના સુક્ષ્મસજીવોની ખેતી કરવામાં આવી નથી.આ સાંસ્કૃતિક પૂર્વગ્રહ ઘણા સૂક્ષ્મજીવાણુઓ 4,9 દ્વારા એન્કોડ કરેલી કાર્યાત્મક વિવિધતાનો ઉપયોગ કરવાની અમારી ક્ષમતાને મર્યાદિત કરે છે.
આ મર્યાદાઓને દૂર કરવા માટે, છેલ્લા એક દાયકામાં તકનીકી પ્રગતિએ સંશોધકોને સમગ્ર સમુદાયો (મેટાજેનોમિક્સ) અથવા સિંગલ કોશિકાઓમાંથી સીધા જ (એટલે ​​​​કે, પૂર્વ સંસ્કૃતિ વિના) માઇક્રોબાયલ ડીએનએ ટુકડાઓનું અનુક્રમણ કરવાની મંજૂરી આપી છે.આ ટુકડાઓને મોટા જીનોમ ટુકડાઓમાં એસેમ્બલ કરવાની અને અનુક્રમે બહુવિધ મેટાજેનોમિકલી એસેમ્બલ જીનોમ્સ (MAGs) અથવા સિંગલ એમ્પ્લીફાઈડ જીનોમ્સ (SAGs)નું પુનઃનિર્માણ કરવાની ક્ષમતા, માઇક્રોબાયોમ (એટલે ​​​​કે, માઇક્રોબાયલ સમુદાયો અને માઇક્રોબાયોમ) ના ટેક્સોસેન્ટ્રિક અભ્યાસ માટે એક મહત્વપૂર્ણ તક ખોલે છે.નવા માર્ગો મોકળો કરો.આપેલ વાતાવરણમાં પોતાની આનુવંશિક સામગ્રી) 10,11,12.ખરેખર, તાજેતરના અભ્યાસોએ પૃથ્વી1, 13 પર માઇક્રોબાયલ વિવિધતાના ફાયલોજેનેટિક પ્રતિનિધિત્વને મોટા પ્રમાણમાં વિસ્તરણ કર્યું છે અને વ્યક્તિગત માઇક્રોબાયલ સમુદાયોમાં મોટાભાગની કાર્યાત્મક વિવિધતા જાહેર કરી છે જે અગાઉ સંસ્કારી સૂક્ષ્મજીવો સંદર્ભ જીનોમ સિક્વન્સ (REFs) 14 દ્વારા આવરી લેવામાં આવી ન હતી.યજમાન જિનોમ (એટલે ​​કે, જીનોમ રિઝોલ્યુશન)ના સંદર્ભમાં શોધાયેલ કાર્યાત્મક વિવિધતાને સ્થાન આપવાની ક્ષમતા એ હજુ સુધી અસ્પષ્ટ માઇક્રોબાયલ લાઇનની આગાહી કરવા માટે મહત્વપૂર્ણ છે જે સંભવતઃ નવા કુદરતી ઉત્પાદનો 15,16ને એન્કોડ કરે છે અથવા આવા સંયોજનોને તેમના મૂળ નિર્માતા 17 પર પાછા લાવવા માટે.ઉદાહરણ તરીકે, સંયુક્ત મેટાજેનોમિક અને સિંગલ-સેલ જિનોમિક પૃથ્થકરણના અભિગમને કારણે મેટાબોલિકલી સમૃદ્ધ સ્પોન્જ-સંબંધિત બેક્ટેરિયાના જૂથ કેન્ડિડેટસ એન્ટોથેનેલાની ઓળખ થઈ છે, જે વિવિધ પ્રકારની દવાની સંભવિતતાના ઉત્પાદકો તરીકે છે.જો કે, વિવિધ માઇક્રોબાયલ સમુદાયોના જીનોમિક સંશોધનના તાજેતરના પ્રયાસો છતાં, 16,19 ઇકોસિસ્ટમના પૃથ્વીના સૌથી મોટા મહાસાગર માટે વૈશ્વિક મેટાજેનોમિક ડેટાના બે તૃતીયાંશ કરતાં વધુ 16,20 હજુ પણ ખૂટે છે.આમ, સામાન્ય રીતે, દરિયાઈ માઇક્રોબાયોમની બાયોસિન્થેટિક સંભવિતતા અને નવલકથા એન્ઝાઈમેટિક અને કુદરતી ઉત્પાદનોના ભંડાર તરીકે તેની સંભવિતતા મોટે ભાગે અણધારી રહે છે.
વૈશ્વિક સ્તરે દરિયાઈ માઇક્રોબાયોમ્સની જૈવસંશ્લેષણ ક્ષમતાનું અન્વેષણ કરવા માટે, અમે સૌપ્રથમ ફિલોજેનેટિક્સ અને જીન ફંક્શનનો વ્યાપક ડેટાબેઝ બનાવવા માટે સંસ્કૃતિ આધારિત અને બિન-સંસ્કૃતિ પદ્ધતિઓનો ઉપયોગ કરીને મેળવેલા દરિયાઈ માઇક્રોબાયલ જીનોમને એકત્રિત કર્યા.આ ડેટાબેઝની તપાસમાં બાયોસિન્થેટિક જનીન ક્લસ્ટર (BGCs)ની વિશાળ વિવિધતા બહાર આવી છે, જેમાંથી મોટા ભાગના હજુ સુધી અનચરેક્ટરાઇઝ્ડ જીન ક્લસ્ટર (GCF) પરિવારોના છે.વધુમાં, અમે એક અજાણ્યા બેક્ટેરિયલ કુટુંબને ઓળખી કાઢ્યું છે જે આજ સુધી ખુલ્લા સમુદ્રમાં BGC ની સૌથી વધુ જાણીતી વિવિધતા દર્શાવે છે.અમે હાલમાં જાણીતા માર્ગોમાંથી તેમના આનુવંશિક તફાવતોને આધારે પ્રાયોગિક માન્યતા માટે બે રિબોસોમલ સિન્થેસિસ અને પોસ્ટ-ટ્રાન્સલેશનલી મોડિફાઇડ પેપ્ટાઇડ (RiPP) માર્ગો પસંદ કર્યા છે.આ માર્ગોના કાર્યાત્મક લાક્ષણિકતાએ એન્ઝાઇમોલોજીના અણધાર્યા ઉદાહરણો તેમજ પ્રોટીઝ અવરોધક પ્રવૃત્તિ સાથે માળખાકીય રીતે અસામાન્ય સંયોજનો જાહેર કર્યા છે.
શરૂઆતમાં, અમે જીનોમ વિશ્લેષણ માટે વૈશ્વિક ડેટા સંસાધન બનાવવાનું લક્ષ્ય રાખ્યું હતું, તેના બેક્ટેરિયલ અને પુરાતત્વીય ઘટકો પર ધ્યાન કેન્દ્રિત કર્યું હતું.આ માટે, અમે 215 વૈશ્વિક સ્તરે વિતરિત સેમ્પલિંગ સાઇટ્સ (અક્ષાંશ શ્રેણી = 141.6°) અને કેટલાક ઊંડા સ્તરો (1 થી 5600 મીટરની ઊંડાઈ સુધી, પેલેજિક, મેસોપેલેજિક અને એબિસલ ઝોનને આવરી લેતા) માંથી મેટાજેનોમિક ડેટા અને 1038 દરિયાઈ પાણીના નમૂનાઓ એકત્રિત કર્યા.પૃષ્ઠભૂમિ21,22,23 (ફિગ. 1a, વિસ્તૃત ડેટા, ફિગ. 1a અને પૂરક કોષ્ટક 1).વિશાળ ભૌગોલિક કવરેજ પ્રદાન કરવા ઉપરાંત, આ પસંદગીયુક્ત રીતે ફિલ્ટર કરેલા નમૂનાઓએ અમને દરિયાઈ માઇક્રોબાયોમના વિવિધ ઘટકોની તુલના કરવાની મંજૂરી આપી, જેમાં વાયરસથી ભરપૂર (<0.2 µm), પ્રોકાર્યોટિક-સમૃદ્ધ (0.2–3 µm), કણોથી સમૃદ્ધ (0.8 µm) ).–20 µm) અને વાયરસથી ક્ષતિગ્રસ્ત (>0.2 µm) વસાહતો.
a, દરિયાઈ માઇક્રોબાયલ સમુદાયોના કુલ 1038 સાર્વજનિક રૂપે ઉપલબ્ધ જીનોમ્સ (મેટાજેનોમિક્સ) 215 વૈશ્વિક સ્તરે વિતરિત સ્થળો (62°S થી 79°N અને 179°W થી 179°E.)માંથી એકત્રિત કરવામાં આવ્યા છે.નકશો ટાઇલ્સ © Esri.સ્ત્રોતો: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ, અને Esri.b, આ મેટાજેનોમ્સનો ઉપયોગ MAGs (પદ્ધતિઓ અને વધારાની માહિતી) પુનઃનિર્માણ કરવા માટે કરવામાં આવ્યો હતો, જે ડેટાસેટ્સ (રંગમાં ચિહ્નિત) માં જથ્થા અને ગુણવત્તા (પદ્ધતિઓ) માં અલગ પડે છે.પુનઃનિર્માણ કરાયેલ MAG ને સાર્વજનિક રૂપે ઉપલબ્ધ (બાહ્ય) જીનોમ સાથે પૂરક બનાવવામાં આવ્યા હતા, જેમાં હસ્તકલા MAG26, SAG27 અને REF નો સમાવેશ થાય છે.27 OMD કમ્પાઇલ કરો.c, માત્ર SAG (GORG)20 અથવા MAG (GEM)16 પર આધારિત અગાઉના અહેવાલોની સરખામણીમાં, OMD દરિયાઈ માઇક્રોબાયલ સમુદાયોના જીનોમિક લાક્ષણિકતા (મેટાજેનોમિક રીડ મેપિંગ રેટ; પદ્ધતિ) ને બે થી ત્રણ ગણો વધુ ઊંડાણમાં વધુ સુસંગત રજૂઆત સાથે સુધારે છે અને અક્ષાંશ.<0.2, n=151, 0.2-0.8, n=67, 0.2-3, n=180, 0.8-20, n=30, >0.2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, OMD જાતિના ક્લસ્ટર સ્તરમાં જૂથબંધી (95% એટલે કે ન્યુક્લિયોટાઇડ ઓળખ) કુલને ઓળખે છે અંદાજે 8300 પ્રજાતિઓ, જેમાંથી અડધા કરતાં વધુને અગાઉ GTDB (સંસ્કરણ 89) e નો ઉપયોગ કરીને વર્ગીકરણ ટીકાઓ અનુસાર વર્ગીકૃત કરવામાં આવી નથી, જીનોમ પ્રકાર દ્વારા જાતિઓનું વર્ગીકરણ દર્શાવે છે કે MAG, SAG અને REFs ફિલોજેનેટિક વિવિધતાને પ્રતિબિંબિત કરવામાં એકબીજાના પૂરક છે. દરિયાઈ માઇક્રોબાયોમ.ખાસ કરીને, 55%, 26% અને 11% જાતિઓ અનુક્રમે MAG, SAG અને REF માટે વિશિષ્ટ હતી.BATS, બર્મુડા એટલાન્ટિક ટાઈમ સિરીઝ;GEM, પૃથ્વીના માઇક્રોબાયોમના જીનોમ;GORG, વૈશ્વિક મહાસાગર સંદર્ભ જીનોમ;HOT, હવાઇયન મહાસાગર સમય શ્રેણી.
આ ડેટાસેટનો ઉપયોગ કરીને, અમે કુલ 26,293 MAGsનું પુનઃનિર્માણ કર્યું, મોટાભાગે બેક્ટેરિયલ અને આર્કિયલ (ફિગ. 1b અને વિસ્તૃત ડેટા, ફિગ. 1b).અમે આ MAGs વિવિધ સ્થાનો અથવા સમય બિંદુઓ (પદ્ધતિઓ) ના નમૂનાઓ વચ્ચેના કુદરતી ક્રમની વિવિધતાના પતનને રોકવા માટે એકત્રિત મેટાજેનોમિક નમૂનાઓને બદલે અલગથી એસેમ્બલીમાંથી બનાવ્યા છે.વધુમાં, અમે મોટી સંખ્યામાં નમૂનાઓમાં તેમના પ્રચલિત સહસંબંધોના આધારે જીનોમિક ટુકડાઓને જૂથબદ્ધ કર્યા છે (મોજણીના આધારે 58 થી 610 નમૂનાઓ; પદ્ધતિ).અમને જાણવા મળ્યું કે આ એક સમય માંગી લેતું પરંતુ મહત્વપૂર્ણ પગલું24 છે જે ઘણા મોટા પાયે MAG16, 19, 25 પુનઃનિર્માણ કાર્યોમાં છોડવામાં આવ્યું હતું અને તે જથ્થા (સરેરાશ 2.7-ગણો) અને ગુણવત્તા (સરેરાશ +20%) નોંધપાત્ર રીતે સુધારે છે. જીનોમઅહીં અભ્યાસ કરાયેલ દરિયાઈ મેટાજેનોમમાંથી પુનઃનિર્માણ (વિસ્તૃત ડેટા, ફિગ. 2a અને વધારાની માહિતી).એકંદરે, આ પ્રયાસોના પરિણામે દરિયાઈ માઇક્રોબાયલ MAGsમાં 4.5-ગણો વધારો થયો છે (જો માત્ર ઉચ્ચ-ગુણવત્તાવાળા MAGs ગણવામાં આવે તો 6-ગણો) આજે ઉપલબ્ધ સૌથી વ્યાપક MAG સંસાધન 16 (પદ્ધતિઓ)ની સરખામણીમાં.આ નવા બનાવેલા MAG સેટને પછી 830 હાથથી પસંદ કરાયેલ MAG26s, 5969 SAG27s અને 1707 REFs સાથે જોડવામાં આવ્યા હતા.દરિયાઈ બેક્ટેરિયા અને આર્કિઆની સત્તાવીસ પ્રજાતિઓ 34,799 જિનોમ્સ (ફિગ. 1b)નો સંયુક્ત સંગ્રહ બનાવે છે.
ત્યારપછી અમે દરિયાઈ સુક્ષ્મજીવાણુ સમુદાયોનું પ્રતિનિધિત્વ કરવાની ક્ષમતા સુધારવા અને વિવિધ જીનોમ પ્રકારોને એકીકૃત કરવાની અસરનું મૂલ્યાંકન કરવા માટે નવા બનાવેલા સંસાધનનું મૂલ્યાંકન કર્યું.સરેરાશ, અમને જાણવા મળ્યું છે કે તે દરિયાઈ મેટાજેનોમિક ડેટા (આકૃતિ 1c) ના આશરે 40-60% આવરી લે છે, જે ઊંડાણ અને અક્ષાંશ બંનેમાં અગાઉના MAG-માત્ર અહેવાલોના કવરેજ કરતાં બે થી ત્રણ ગણા વધુ શ્રેણી 16 અથવા SAG20.વધુમાં, સ્થાપિત સંગ્રહોમાં વર્ગીકરણની વિવિધતાને વ્યવસ્થિત રીતે માપવા માટે, અમે જીનોમ ટેક્સોનોમી ડેટાબેઝ (GTDB) ટૂલકીટ (પદ્ધતિઓ) નો ઉપયોગ કરીને તમામ જીનોમને ટીકા કરી અને 95% ની સરેરાશ જીનોમ-વ્યાપી ન્યુક્લિયોટાઇડ ઓળખનો ઉપયોગ કર્યો.8,304 પ્રજાતિઓના ક્લસ્ટરો (પ્રજાતિ) ને ઓળખવા માટે 28.આમાંની બે તૃતીયાંશ પ્રજાતિઓ (નવા ક્લેડ સહિત) અગાઉ GTDBમાં દેખાઈ ન હતી, જેમાંથી 2790 આ અભ્યાસમાં પુનઃનિર્માણ કરાયેલ MAG નો ઉપયોગ કરીને શોધવામાં આવી હતી (ફિગ. 1d).વધુમાં, અમને જાણવા મળ્યું કે વિવિધ પ્રકારના જિનોમ અત્યંત પૂરક છે: 55%, 26% અને 11% પ્રજાતિઓ અનુક્રમે MAG, SAG અને REF થી બનેલી છે (ફિગ. 1e).વધુમાં, MAG એ પાણીના સ્તંભમાં જોવા મળતા તમામ 49 પ્રકારોને આવરી લીધા હતા, જ્યારે SAG અને REF એ અનુક્રમે તેમાંથી માત્ર 18 અને 11નું પ્રતિનિધિત્વ કર્યું હતું.જો કે, SAG એ સૌથી સામાન્ય ક્લેડ (વિસ્તૃત ડેટા, ફિગ. 3a), જેમ કે પેલેજિક બેક્ટેરિયાલ્સ (SAR11) ની વિવિધતાને વધુ સારી રીતે રજૂ કરે છે, જેમાં SAG લગભગ 1300 પ્રજાતિઓ અને MAG માત્ર 390 પ્રજાતિઓને આવરી લે છે.નોંધનીય રીતે, REFs ભાગ્યે જ પ્રજાતિના સ્તરે MAGs અથવા SAGs સાથે ઓવરલેપ થાય છે અને 1000 જેટલા જીનોમનું પ્રતિનિધિત્વ કરે છે જે અહીં અભ્યાસ કરાયેલ ખુલ્લા સમુદ્રના મેટાજેનોમિક સેટમાં જોવા મળતા નથી, મુખ્યત્વે અન્ય પ્રકારના અલગ પ્રતિનિધિ દરિયાઈ નમુનાઓ (દા.ત. કાંપ) સાથેની ક્રિયાપ્રતિક્રિયાને કારણે. .અથવા યજમાન-સહયોગી).તેને વૈજ્ઞાનિક સમુદાય માટે બહોળા પ્રમાણમાં ઉપલબ્ધ કરાવવા માટે, આ દરિયાઈ જિનોમ સંસાધન, જેમાં અવર્ગીકૃત ટુકડાઓ પણ સામેલ છે (દા.ત., અનુમાનિત તબક્કાઓ, જીનોમિક ટાપુઓ અને જીનોમ ટુકડાઓ કે જેના માટે MAG પુનઃનિર્માણ માટે અપૂરતો ડેટા છે), તેની તુલના વર્ગીકરણ ડેટા સાથે કરી શકાય છે. .ઓશન માઇક્રોબાયોલોજી ડેટાબેઝ (OMD; https://microbiomics.io/ocean/) માં જનીન કાર્ય અને સંદર્ભિત પરિમાણો સાથે ટીકાઓ ઍક્સેસ કરો.
ત્યાર બાદ અમે ખુલ્લા મહાસાગરના માઇક્રોબાયોમ્સમાં જૈવ-સંશ્લેષણ ક્ષમતાની સમૃદ્ધિ અને નવીનતાનું અન્વેષણ કરવાનું નક્કી કર્યું.આ માટે, અમે કુલ 39,055 BGC ની આગાહી કરવા માટે 1038 દરિયાઈ મેટાજેનોમ્સ (પદ્ધતિઓ) માં જોવા મળતા તમામ MAGs, SAGs અને REFs માટે પ્રથમ antiSMASH નો ઉપયોગ કર્યો.પછી અમે આને 6907 બિન-રિડન્ડન્ટ GCFs અને 151 જનીન ક્લસ્ટર વસ્તી (GCCs; પૂરક કોષ્ટક 2 અને પદ્ધતિઓ) માં સહજ રીડન્ડન્સી (એટલે ​​​​કે, એક જ BGC બહુવિધ જીનોમમાં એન્કોડ કરી શકાય છે) અને સાંદ્રતા BGC નું ફ્રેગમેન્ટેશન મેટાજેનોમિક ડેટામાં જૂથબદ્ધ કર્યું.અપૂર્ણ BGC માં નોંધપાત્ર વધારો થયો નથી, જો કોઈ હોય તો (પૂરક માહિતી), અનુક્રમે GCF અને GCC ની સંખ્યામાં, 44% અને 86% કિસ્સાઓમાં ઓછામાં ઓછા એક અખંડ BGC સભ્ય ધરાવે છે.
GCC સ્તરે, અમને અનુમાનિત RiPPs અને અન્ય કુદરતી ઉત્પાદનોની વિશાળ વિવિધતા મળી (ફિગ. 2a).તેમાંથી, ઉદાહરણ તરીકે, એરીપોલીનિસ, કેરોટીનોઇડ્સ, એક્ટોઇન્સ અને સાઇડરોફોર્સ વ્યાપક ફાયલોજેનેટિક વિતરણ અને દરિયાઈ મેટાજેનોમ્સમાં ઉચ્ચ વિપુલતા સાથે જીસીસી સાથે સંબંધ ધરાવે છે, જે દરિયાઇ પર્યાવરણમાં સુક્ષ્મસજીવોના વિશાળ અનુકૂલનને સૂચવી શકે છે, જેમાં પ્રતિક્રિયાશીલ ઓક્સિજનનો પ્રતિકાર શામેલ છે. ઓક્સિડેટીવ અને ઓસ્મોટિક તણાવ..અથવા આયર્ન શોષણ (વધુ માહિતી).આ કાર્યાત્મક વિવિધતા એનસીબીઆઈ રેફસેક ડેટાબેઝમાં સંગ્રહિત આશરે 190,000 જીનોમમાં આશરે 1.2 મિલિયન BGC ના તાજેતરના વિશ્લેષણ સાથે વિરોધાભાસી છે (BiG-FAM/RefSeq, જે પછીથી RefSeq) તરીકે ઓળખાય છે) આઇડી સિન્થેઝ (PKS) BGCs (પૂરક માહિતી).અમને 44 (29%) GCCs પણ મળ્યાં છે જે ફક્ત MAG માં કોઈપણ RefSeq BGC (\(\bar{d}\)RefSeq > 0.4; ફિગ. 2a અને પદ્ધતિઓ) અને 53 (35%) GCC સાથે દૂરથી સંબંધિત છે, જે સંભવિતને પ્રકાશિત કરે છે. OMD માં અગાઉ વર્ણવેલ રસાયણો શોધવા માટે.આપેલ છે કે આમાંના દરેક GCC અત્યંત વૈવિધ્યસભર જૈવ-સંશ્લેષણ કાર્યોનું પ્રતિનિધિત્વ કરે છે, અમે સમાન કુદરતી ઉત્પાદનો માટે કોડ માટે અનુમાનિત BGCs નું વધુ વિગતવાર જૂથ પ્રદાન કરવાના પ્રયાસરૂપે GCF સ્તરે ડેટાનું વધુ વિશ્લેષણ કર્યું છે29.કુલ 3861 (56%) ઓળખાયેલ GCFs RefSeq સાથે ઓવરલેપ થયા ન હતા, અને >97% GCF MIBiG માં હાજર ન હતા, જે પ્રાયોગિક રીતે માન્ય BGCs (આકૃતિ 2b) ના સૌથી મોટા ડેટાબેઝમાંના એક છે.સંદર્ભ જિનોમ દ્વારા સારી રીતે દર્શાવવામાં આવતાં ન હોય તેવા સેટિંગ્સમાં ઘણા સંભવિત નવલકથા માર્ગો શોધવામાં આશ્ચર્યજનક બાબત નથી, જ્યારે બેન્ચમાર્કિંગ પહેલાં BGC ને GCF માં પ્રતિકૃતિ બનાવવા માટેની અમારી પદ્ધતિ અગાઉના અહેવાલો 16 કરતાં અલગ છે અને અમને નવીનતાનું નિષ્પક્ષ મૂલ્યાંકન પ્રદાન કરવાની મંજૂરી આપે છે.મોટાભાગની નવી વિવિધતા (3012 GCF અથવા 78%) અનુમાનિત ટર્પેન્સ, RiPP અથવા અન્ય કુદરતી ઉત્પાદનોને અનુરૂપ છે, અને મોટાભાગની (1815 GCF અથવા 47%) તેમની જૈવ-સંશ્લેષણ ક્ષમતાને કારણે અજાણ્યા પ્રકારોમાં એન્કોડેડ છે.PKS અને NRPS ક્લસ્ટરોથી વિપરીત, આ કોમ્પેક્ટ BGCs મેટાજેનોમિક એસેમ્બલી 31 દરમિયાન વિભાજિત થવાની શક્યતા ઓછી હોય છે અને તેમના ઉત્પાદનોના વધુ સમય- અને સંસાધન-સઘન કાર્યાત્મક લાક્ષણિકતાને મંજૂરી આપે છે.
કુલ 39,055 BGC ને 6,907 GCF અને 151 GCC માં જૂથબદ્ધ કરવામાં આવ્યા હતા.a, ડેટા રજૂઆત (આંતરિક બાહ્ય).GCC પર આધારિત BGC અંતરનું અધિક્રમિક ક્લસ્ટરિંગ, જેમાંથી 53 માત્ર MAG દ્વારા નક્કી કરવામાં આવ્યા છે.GCC માં વિવિધ ટેક્સા (ln-રૂપાંતરિત ગેટ ફ્રીક્વન્સી) અને વિવિધ BGC વર્ગો (વર્તુળનું કદ તેની આવર્તનને અનુરૂપ છે) માંથી BGC ધરાવે છે.દરેક GCC માટે, બાહ્ય સ્તર BGC ની સંખ્યા, વ્યાપ (નમૂનાઓની ટકાવારી), અને અંતર (ન્યૂનતમ BGC કોસાઇન અંતર (min(dMIBiG))) BiG-FAM થી BGC સુધીનું પ્રતિનિધિત્વ કરે છે.પ્રાયોગિક રીતે ચકાસાયેલ BGCs (MIBiG) સાથે નજીકથી સંબંધિત BGC સાથે GCC એરો વડે પ્રકાશિત થાય છે.b અનુમાનિત (BiG-FAM) અને પ્રાયોગિક રીતે માન્ય (MIBiG) BGCs સાથે GCF ની સરખામણી કરતાં, 3861 નવા (d–>0.2) GCF મળી આવ્યા.મોટાભાગના (78%) આ કોડ RiPP, ટેર્પેન્સ અને અન્ય પ્રાકૃતિક ઉત્પાદનો માટે છે.c, 1038 દરિયાઈ મેટાજેનોમમાં જોવા મળતા OMDમાંના તમામ જીનોમને OMD ના ફાયલોજેનેટિક કવરેજ બતાવવા માટે GTDB બેઝ ટ્રીમાં મૂકવામાં આવ્યા હતા.OMD માં કોઈપણ જીનોમ વગરના ક્લેડ ગ્રે રંગમાં દર્શાવવામાં આવ્યા છે.BGC ની સંખ્યા આપેલ ક્લેડમાં જીનોમ દીઠ અનુમાનિત BGC ની સૌથી મોટી સંખ્યાને અનુરૂપ છે.સ્પષ્ટતા માટે, છેલ્લા 15% નોડ્સ તૂટી ગયા છે.તીરો BGC (>15 BGC) માં સમૃદ્ધ ક્લેડ સૂચવે છે, માયકોબેક્ટેરિયમ, ગોર્ડોનિયા (માત્ર રોડોકોકસ પછી બીજા ક્રમે), અને ક્રોકોસ્ફેરા (ફક્ત સિનેકોકોકસ પછી બીજા ક્રમે).d, અજ્ઞાત c.Eremiobacterota એ સર્વોચ્ચ જૈવ કૃત્રિમ વિવિધતા દર્શાવી (કુદરતી ઉત્પાદન પ્રકાર પર આધારિત શેનોન ઇન્ડેક્સ).દરેક બેન્ડ પ્રજાતિઓમાં સૌથી વધુ BGC ધરાવતા જીનોમનું પ્રતિનિધિત્વ કરે છે.T1PKS, PKS પ્રકાર I, T2/3PKS, PKS પ્રકાર II અને પ્રકાર III.
સમૃદ્ધિ અને નવીનતા ઉપરાંત, અમે દરિયાઈ માઇક્રોબાયોમની બાયોસિન્થેટિક સંભવિતતાની જૈવભૌગોલિક રચનાનું અન્વેષણ કરીએ છીએ.સરેરાશ મેટાજેનોમિક GCF કોપી નંબર ડિસ્ટ્રિબ્યુશન (પદ્ધતિઓ) દ્વારા નમૂનાઓનું જૂથીકરણ દર્શાવે છે કે નીચા-અક્ષાંશ, સપાટી, પ્રોકાર્યોટિક-સમૃદ્ધ અને વાયરસ-ગરીબ સમુદાયો, મોટાભાગે સપાટી અથવા ઊંડા સૂર્યપ્રકાશવાળા પાણીમાંથી, RiPP અને BGC ટેર્પેન્સથી સમૃદ્ધ હતા.તેનાથી વિપરીત, ધ્રુવીય, ઊંડા સમુદ્ર, વાયરસ- અને કણોથી સમૃદ્ધ સમુદાયો NRPS અને PKS BGC (વિસ્તૃત ડેટા, ફિગ. 4 અને વધારાની માહિતી) ની ઉચ્ચ વિપુલતા સાથે સંકળાયેલા હતા.અંતે, અમે શોધી કાઢ્યું કે સારી રીતે અભ્યાસ કરેલ ઉષ્ણકટિબંધીય અને પેલેજિક સમુદાયો નવા ટેર્પેન્સ (સંવર્ધિત ડેટા ફિગર) ના સૌથી આશાસ્પદ સ્ત્રોત છે.PKS, RiPP અને અન્ય કુદરતી ઉત્પાદનો માટે સૌથી વધુ સંભવિત (વિસ્તૃત ડેટા સાથે આકૃતિ 5a).
દરિયાઈ માઇક્રોબાયોમ્સની બાયોસિન્થેટિક સંભવિતતાના અમારા અભ્યાસને પૂરક બનાવવા માટે, અમે તેમના ફાયલોજેનેટિક વિતરણને મેપ કરવાનો અને નવા BGC-સમૃદ્ધ ક્લેડને ઓળખવાનું લક્ષ્ય રાખ્યું છે.આ માટે, અમે દરિયાઈ જીવાણુઓના જીનોમને સામાન્ય GTDB13 બેક્ટેરિયલ અને આર્કિયલ ફાયલોજેનેટિક વૃક્ષમાં મૂક્યા અને તેઓ એન્કોડ કરેલા પુટેટિવ ​​બાયોસિન્થેટિક માર્ગોને ઢાંકી દીધા (ફિગ. 2c).અમે દરિયાઈ પાણીના નમૂનાઓ (પદ્ધતિઓ) માં ઘણા BGC-સમૃદ્ધ ક્લેડ (15 થી વધુ BGC દ્વારા રજૂ) સરળતાથી શોધી કાઢ્યા છે જે તેમની બાયોસિન્થેટિક સંભવિતતા માટે જાણીતા છે, જેમ કે સાયનોબેક્ટેરિયા (સિનેકોકોકસ) અને પ્રોટીયસ બેક્ટેરિયા, જેમ કે ટિસ્ટ્રેલા 32,33, અથવા તાજેતરમાં તેમના માટે ધ્યાન આકર્ષિત કરવામાં આવ્યું હતું. કુદરતી ઉત્પાદનો.જેમ કે માયક્સોકોકોટા (સંડારેસિનેસી), રોડોકોકસ અને પ્લાન્કટોમીસેટોટા34,35,36.રસપ્રદ વાત એ છે કે, અમને આ ક્લેડ્સમાં અગાઉ અન્વેષણ કરાયેલા કેટલાય વંશ મળ્યા છે.ઉદાહરણ તરીકે, ફાયલા પ્લાંક્ટોમીસેટોટા અને માયક્સોકોકોટામાં સૌથી ધનિક જૈવસંશ્લેષણ ક્ષમતા ધરાવતી તે પ્રજાતિઓ અનુક્રમે અવિભાજિત ઉમેદવારોના ઓર્ડર અને જનરાથી સંબંધિત છે (પૂરક કોષ્ટક 3).એકસાથે લેવામાં આવે તો, આ સૂચવે છે કે OMD અગાઉની અજ્ઞાત ફાયલોજેનેટિક માહિતીની ઍક્સેસ પ્રદાન કરે છે, જેમાં સૂક્ષ્મજીવોનો સમાવેશ થાય છે, જે એન્ઝાઇમ અને કુદરતી ઉત્પાદનની શોધ માટે નવા લક્ષ્યોનું પ્રતિનિધિત્વ કરી શકે છે.
આગળ, અમે BGC-સમૃદ્ધ ક્લેડને માત્ર તેના સભ્યો દ્વારા એનકોડ કરેલા BGCsની મહત્તમ સંખ્યાની ગણતરી કરીને જ નહીં, પણ આ BGCsની વિવિધતાનું મૂલ્યાંકન કરીને પણ દર્શાવ્યું છે, જે વિવિધ પ્રકારના કુદરતી ઉમેદવાર ઉત્પાદનોની આવૃત્તિ સમજાવે છે (ફિગ. 2c અને પદ્ધતિઓ )..અમને જાણવા મળ્યું છે કે આ અભ્યાસમાં સૌથી વધુ જૈવ કૃત્રિમ રીતે વૈવિધ્યસભર પ્રજાતિઓ ખાસ એન્જિનિયર્ડ બેક્ટેરિયલ MAGs દ્વારા રજૂ કરવામાં આવી હતી.આ બેક્ટેરિયા બિનઉછેરિત ફાઈલમ કેન્ડીડેટસ એરેમીઓબેક્ટેરોટાના છે, જે થોડા જીનોમિક અભ્યાસો સિવાય મોટાભાગે વણશોધાયેલ છે37,38.ઉલ્લેખનીય છે કે “ca.Eremiobacterota જીનસનું માત્ર પાર્થિવ વાતાવરણમાં જ વિશ્લેષણ કરવામાં આવ્યું છે39 અને BGCમાં સમૃદ્ધ બનેલા કોઈપણ સભ્યોનો સમાવેશ કરવા માટે જાણીતું નથી.અહીં અમે એક જ પ્રજાતિના આઠ MAG નું પુનઃનિર્માણ કર્યું છે (ન્યુક્લિયોટાઇડ ઓળખ > 99%) 23. તેથી અમે ગ્રીક પૌરાણિક કથાઓ અને અભિયાનોમાં એક સુંદર ભેટ, નેરીડ (સમુદ્ર અપ્સરા)ના નામ પરથી "કેન્ડિડેટસ યુડોરેમિક્રોબિયમ માલસ્પિની" પ્રજાતિના નામનો પ્રસ્તાવ મૂક્યો છે.'કા.ફાયલોજેનેટિક એનોટેશન 13 મુજબ, E. malaspinii ક્રમ સ્તરથી નીચે કોઈ અગાઉ જાણીતા સંબંધીઓ નથી અને તેથી તે એક નવા બેક્ટેરિયલ પરિવાર સાથે સંબંધ ધરાવે છે જેને અમે “Ca.E. malaspinii” પ્રકાર પ્રજાતિ તરીકે અને “Ca.Eudormicrobiaceae” સત્તાવાર નામ તરીકે (પૂરક માહિતી).'Ca.નું સંક્ષિપ્ત મેટાજેનોમિક પુનર્નિર્માણ.E. malaspinii જિનોમ પ્રોજેક્ટને 75 kb ડુપ્લિકેશન સાથે સિંગલ 9.63 Mb રેખીય રંગસૂત્ર તરીકે ખૂબ જ ઓછા ઇનપુટ, લાંબા વાંચેલા મેટાજેનોમિક સિક્વન્સિંગ અને સિંગલ સેમ્પલ (પદ્ધતિઓ) ની લક્ષિત એસેમ્બલી દ્વારા માન્ય કરવામાં આવ્યો હતો.માત્ર બાકી રહેલી અસ્પષ્ટતા તરીકે.
આ પ્રજાતિના ફાયલોજેનેટિક સંદર્ભને સ્થાપિત કરવા માટે, અમે લક્ષ્યાંકિત જીનોમ પુનઃનિર્માણ દ્વારા તારા મહાસાગર અભિયાનમાંથી વધારાના યુકેરીયોટિક-સમૃદ્ધ મેટાજેનોમિક નમૂનાઓમાં 40 નજીકથી સંબંધિત પ્રજાતિઓની શોધ કરી.સંક્ષિપ્તમાં, અમે મેટાજેનોમિક રીડ્સને "Ca" સાથે સંકળાયેલ જીનોમિક ટુકડાઓ સાથે જોડ્યા છે.E. malaspinii” અને અનુમાન લગાવ્યું કે આ નમૂનામાં ભરતીનો વધારો અન્ય સંબંધીઓ (પદ્ધતિઓ) ની હાજરી સૂચવે છે.પરિણામે, અમને 10 MAGs મળ્યાં, જે 19 MAGsનું સંયોજન છે જે નવા નિર્ધારિત કુટુંબમાં ત્રણ જાતિઓમાં પાંચ પ્રજાતિઓનું પ્રતિનિધિત્વ કરે છે (એટલે ​​કે “Ca. Eudormicrobiaceae”).મેન્યુઅલ નિરીક્ષણ અને ગુણવત્તા નિયંત્રણ (વિસ્તૃત ડેટા, ફિગ. 6 અને વધારાની માહિતી) પછી, અમને જાણવા મળ્યું કે “Ca.Eudormicrobiaceae પ્રજાતિઓ અન્ય “Ca” સભ્યો કરતાં મોટા જીનોમ (8 Mb) અને સમૃદ્ધ જૈવસંશ્લેષણ ક્ષમતા (પ્રજાતિ દીઠ 14 થી 22 BGC) રજૂ કરે છે.ક્લેડ Eremiobacterota (7 BGC સુધી) (ફિગ. 3a–c).
a, પાંચ 'Ca ની ફાયલોજેનેટિક સ્થિતિ.Eudormicrobiaceae ની પ્રજાતિઓએ આ અભ્યાસમાં ઓળખાયેલી દરિયાઈ રેખાઓ માટે વિશિષ્ટ BGC સમૃદ્ધિ દર્શાવી હતી.ફાયલોજેનેટિક વૃક્ષમાં તમામ 'Ca'નો સમાવેશ થાય છે.MAG Eremiobacterota અને GTDB (સંસ્કરણ 89) માં આપવામાં આવેલ અન્ય ફાયલા (કૌંસમાં જીનોમ નંબરો) ના સભ્યોનો ઉપયોગ ઉત્ક્રાંતિની પૃષ્ઠભૂમિ (પદ્ધતિઓ) માટે કરવામાં આવ્યો હતો.સૌથી બહારના સ્તરો કૌટુંબિક સ્તરે (“Ca. Eudormicrobiaceae” અને “Ca. Xenobiaceae”) અને વર્ગ સ્તરે (“Ca. Eremiobacteria”) વર્ગીકરણનું પ્રતિનિધિત્વ કરે છે.આ અભ્યાસમાં વર્ણવેલ પાંચ પ્રજાતિઓ આલ્ફાન્યૂમેરિક કોડ્સ અને સૂચિત દ્વિપદી નામો (પૂરક માહિતી) દ્વારા દર્શાવવામાં આવી છે.b, ઠીક છે.Eudormicrobiaceae પ્રજાતિઓ સાત સામાન્ય BGC ન્યુક્લી ધરાવે છે.A2 ક્લેડમાં BGC ની ગેરહાજરી પ્રતિનિધિ MAG (પૂરક કોષ્ટક 3) ની અપૂર્ણતાને કારણે હતી.BGCs ચોક્કસ છે “Ca.એમ્ફિથોમાઇક્રોબિયમ" અને "Ca.એમ્ફિથોમાઇક્રોબિયમ” (ક્લેડ્સ A અને B) બતાવવામાં આવ્યા નથી.c, "Ca તરીકે એન્કોડ કરેલ તમામ BGC.Eudoremicrobium taraoceanii તારાના મહાસાગરોમાંથી લેવામાં આવેલા 623 મેટાટ્રાન્સક્રિપ્ટોમ્સમાં વ્યક્ત કરવામાં આવ્યું હોવાનું જણાયું હતું.નક્કર વર્તુળો સક્રિય ટ્રાન્સક્રિપ્શન સૂચવે છે.નારંગી વર્તુળો હાઉસકીપિંગ જનીન અભિવ્યક્તિ દર (પદ્ધતિઓ) ની નીચે અને ઉપર લોગ2-રૂપાંતરિત ફોલ્ડ ફેરફારો દર્શાવે છે.d, સાપેક્ષ વિપુલતા વણાંકો (પદ્ધતિઓ) 'Ca દર્શાવે છે.Eudormicrobiaceaeની પ્રજાતિઓ મોટાભાગના સમુદ્રી તટપ્રદેશમાં અને સમગ્ર જળસ્તંભમાં (સપાટીથી ઓછામાં ઓછી 4000 મીટરની ઊંડાઈ સુધી) વ્યાપક છે.આ અંદાજોના આધારે, અમને જાણવા મળ્યું કે 'Ca.ડીપ-સી પેલેજિક અનાજ-સંબંધિત સમુદાયોમાં પ્રોકાર્યોટિક કોષોમાં E. malaspinii' 6% સુધીનો હિસ્સો ધરાવે છે.જો તે આપેલ ઊંડાણના સ્તરના કદના કોઈપણ અપૂર્ણાંકમાં જોવા મળે તો અમે કોઈ પ્રજાતિને સાઇટ પર હાજર હોવાનું માનીએ છીએ.IO - હિંદ મહાસાગર, NAO - ઉત્તર એટલાન્ટિક, NPO - ઉત્તર પેસિફિક, RS - લાલ સમુદ્ર, SAO - દક્ષિણ એટલાન્ટિક, SO - દક્ષિણ મહાસાગર, SPO - દક્ષિણ પેસિફિક.
Ca ની વિપુલતા અને વિતરણનો અભ્યાસ કરવો.Eudormicrobiaceae, જે આપણે શોધી કાઢ્યું છે તેમ, મોટાભાગના સમુદ્રી તટપ્રદેશોમાં તેમજ સમગ્ર જળસ્તંભમાં (ફિગ. 3d) પ્રબળ છે.સ્થાનિક રીતે, તેઓ દરિયાઈ માઇક્રોબાયલ સમુદાયનો 6% હિસ્સો બનાવે છે, જે તેમને વૈશ્વિક દરિયાઈ માઇક્રોબાયોમનો એક મહત્વપૂર્ણ ભાગ બનાવે છે.વધુમાં, અમને Ca ની સંબંધિત સામગ્રી મળી.Eudormicrobiaceae પ્રજાતિઓ અને તેમના BGC અભિવ્યક્તિ સ્તર યુકેરીયોટિક સમૃદ્ધ અપૂર્ણાંકમાં સૌથી વધુ હતા (ફિગ. 3c અને વિસ્તૃત ડેટા, ફિગ. 7), જે પ્લાન્કટોન સહિત કણો સાથે સંભવિત ક્રિયાપ્રતિક્રિયા સૂચવે છે.આ અવલોકન 'Ca' સાથે થોડી સામ્યતા ધરાવે છે.Eudoremicrobium BGCs કે જે જાણીતા માર્ગો દ્વારા સાયટોટોક્સિક કુદરતી ઉત્પાદનોનું ઉત્પાદન કરે છે તે શિકારી વર્તન (પૂરક માહિતી અને વિસ્તૃત માહિતી, આકૃતિ 8) પ્રદર્શિત કરી શકે છે, જે અન્ય શિકારી જેવા જ છે જે ખાસ કરીને માયક્સોકોકસ41 જેવા ચયાપચય પેદા કરે છે.સીએની શોધ.પ્રાકૃતિક ખાદ્ય સંશોધનના સંદર્ભમાં આ બેક્ટેરિયા અને તેમની અણધારી BGC વિવિધતા શા માટે અસ્પષ્ટ રહે છે તેના બદલે પ્રોકાર્યોટિક નમૂનાઓ કરતાં ઓછા ઉપલબ્ધ (ઊંડા સમુદ્રમાં) અથવા યુકેરીયોટિકમાં યુડોર્માઇક્રોબિયાસીએ સમજાવી શકે છે.
આખરે, અમે નવા માર્ગો, ઉત્સેચકો અને કુદરતી ઉત્પાદનોની શોધમાં અમારા માઇક્રોબાયોમ-આધારિત કાર્યના વચનને પ્રાયોગિક રીતે માન્ય કરવાનો પ્રયાસ કર્યો.BGC ના વિવિધ વર્ગોમાં, પરિપક્વ ઉત્સેચકો42 દ્વારા કોર પેપ્ટાઈડના વિવિધ પોસ્ટ-ટ્રાન્સલેશનલ ફેરફારોને કારણે RiPP પાથવે સમૃદ્ધ રાસાયણિક અને કાર્યાત્મક વિવિધતાને એન્કોડ કરવા માટે જાણીતું છે.તેથી અમે બે 'Cએ પસંદ કર્યા.Eudoremicrobium' RiPP BGCs (આકૃતિ 3b અને 4a-e) કોઈપણ જાણીતા BGC (\(\bar{d}\)MIBiG અને \(\bar{d}\)0.2 ઉપરના RefSeq) પર આધારિત છે.
a–c, ઊંડા સમુદ્રની Ca પ્રજાતિઓ માટે વિશિષ્ટ RiPP બાયોસિન્થેસિસનું ક્લસ્ટર (\(\bar{d}\)RefSeq = 0.29) ક્લસ્ટરના વિટ્રો હેટરોલોગસ એક્સપ્રેશન અને ઇન વિટ્રો એન્ઝાઈમેટિક એસેસ.E. malaspinii' ને કારણે ડિફોસ્ફોરીલેટેડ ઉત્પાદનોનું ઉત્પાદન થયું.c, હાઇ-રિઝોલ્યુશન (HR) MS/MS (રાસાયણિક બંધારણમાં b અને y આયનો દ્વારા સૂચવવામાં આવેલ ફ્રેગમેન્ટેશન) અને NMR (વિસ્તૃત ડેટા, ફિગ. 9) નો ઉપયોગ કરીને ઓળખાયેલ ફેરફારો.d, આ ફોસ્ફોરીલેટેડ પેપ્ટાઈડ સ્તન્ય પ્રાણીઓમાં ગર્ભમાં રહેલા બચ્ચાની રક્ષા માટેનું આચ્છાદન ન્યુટ્રોફિલ ઇલાસ્ટેઝનું નીચું માઇક્રોમોલર નિષેધ દર્શાવે છે, જે નિયંત્રણ પેપ્ટાઇડ અને ડિહાઇડ્રેટિંગ પેપ્ટાઇડ (રાસાયણિક દૂર પ્રેરિત નિર્જલીકરણ) માં જોવા મળતું નથી.સમાન પરિણામો સાથે પ્રયોગ ત્રણ વખત પુનરાવર્તિત કરવામાં આવ્યો હતો.ઉદાહરણ તરીકે, બીજી નવલકથા \(\bar{d}\)RefSeq = 0.33) પ્રોટીન બાયોસિન્થેસિસના ક્લસ્ટરની વિષમ અભિવ્યક્તિ ચાર પરિપક્વ ઉત્સેચકોના કાર્યને સ્પષ્ટ કરે છે જે 46 એમિનો એસિડ કોર પેપ્ટાઈડને સંશોધિત કરે છે.એચઆર-એમએસ/એમએસ, આઇસોટોપ લેબલિંગ અને એનએમઆર વિશ્લેષણ (પૂરક માહિતી) દ્વારા અનુમાનિત ફેરફારની સાઇટ અનુસાર અવશેષો ડાઘવાળા હોય છે.ડેશેડ કલરેશન સૂચવે છે કે ફેરફાર બે અવશેષોમાંથી એક પર થાય છે.આકૃતિ એ એક જ ન્યુક્લિયસ પરના તમામ પરિપક્વ ઉત્સેચકોની પ્રવૃત્તિ બતાવવા માટે અસંખ્ય વિજાતીય રચનાઓનું સંકલન છે.h, બેકબોન એમાઈડ એન-મેથિલેશન માટે NMR ડેટાનું ચિત્રણ.સંપૂર્ણ પરિણામો ફિગમાં બતાવવામાં આવ્યા છે.10 વિસ્તૃત ડેટા સાથે.i, MIBiG 2.0 ડેટાબેઝમાં જોવા મળતા તમામ FkbM ડોમેન્સમાંથી પરિપક્વ FkbM પ્રોટીન ક્લસ્ટર એન્ઝાઇમની ફાયલોજેનેટિક સ્થિતિ N-methyltransferase પ્રવૃત્તિ (પૂરક માહિતી) સાથે આ પરિવારના એન્ઝાઇમને દર્શાવે છે.BGCs (a, e), પુરોગામી પેપ્ટાઇડ સ્ટ્રક્ચર્સ (b, f), અને કુદરતી ઉત્પાદનો (c, g) ના પુટેટિવ ​​કેમિકલ સ્ટ્રક્ચર્સનું યોજનાકીય આકૃતિઓ બતાવવામાં આવે છે.
પ્રથમ RiPP પાથવે (\(\bar{d}\)MIBiG = 0.41, \(\bar{d}\)RefSeq = 0.29) માત્ર ઊંડા સમુદ્રની પ્રજાતિઓ “Ca.E. malaspinii” અને પેપ્ટાઈડ- પૂર્વવર્તી માટે કોડ (ફિગ. 4a, b).આ પરિપક્વ એન્ઝાઇમમાં, અમે લેન્ટિપેપ્ટાઇડ સિન્થેઝના ડિહાઇડ્રેશન ડોમેન માટે સમાન કાર્યાત્મક ડોમેન ઓળખી કાઢ્યું છે જે સામાન્ય રીતે ફોસ્ફોરાયલેશન અને 43 (પૂરક માહિતી) ના અનુગામી નિરાકરણને ઉત્પ્રેરિત કરે છે.તેથી, અમે આગાહી કરીએ છીએ કે પૂર્વવર્તી પેપ્ટાઇડના ફેરફારમાં આવા બે-પગલાંના નિર્જલીકરણનો સમાવેશ થાય છે.જો કે, ટેન્ડમ માસ સ્પેક્ટ્રોમેટ્રી (MS/MS) અને ન્યુક્લિયર મેગ્નેટિક રેઝોનન્સ સ્પેક્ટ્રોસ્કોપી (NMR) નો ઉપયોગ કરીને, અમે પોલીફોસ્ફોરીલેટેડ રેખીય પેપ્ટાઈડ (ફિગ. 4c) ઓળખી કાઢ્યા.અણધારી હોવા છતાં, અમને તેના અંતિમ ઉત્પાદન હોવાને સમર્થન આપવા માટે પુરાવાઓની ઘણી રેખાઓ મળી: બે અલગ અલગ હેટરોલોગસ હોસ્ટ્સ અને ઇન વિટ્રો એસેસમાં કોઈ ડિહાઇડ્રેશન નથી, પરિપક્વ એન્ઝાઇમના ઉત્પ્રેરક ડિહાઇડ્રેશન સાઇટમાં પરિવર્તિત મુખ્ય અવશેષોની ઓળખ.બધા "Ca" દ્વારા પુનઃનિર્માણ.E. malaspinii જિનોમ (વિસ્તૃત ડેટા, ફિગ. 9 અને વધારાની માહિતી) અને છેવટે, ફોસ્ફોરીલેટેડ ઉત્પાદનની જૈવિક પ્રવૃત્તિ, પરંતુ રાસાયણિક રીતે સંશ્લેષિત નિર્જલીકૃત સ્વરૂપ (ફિગ. 4d) નથી.હકીકતમાં, અમે જોયું કે તે ન્યુટ્રોફિલ ઇલાસ્ટેઝ સામે ઓછી માઇક્રોમોલર પ્રોટીઝ અવરોધક પ્રવૃત્તિ દર્શાવે છે, જે સાંદ્રતા શ્રેણી (IC50 = 14.3 μM) 44 માં અન્ય સંબંધિત કુદરતી ઉત્પાદનો સાથે તુલનાત્મક છે, તે હકીકત હોવા છતાં કે ઇકોલોજીકલ ભૂમિકા સ્પષ્ટ કરવાની બાકી છે.આ પરિણામોના આધારે, અમે માર્ગને "ફોસ્ફેપ્ટિન" નામ આપવાનું સૂચન કરીએ છીએ.
બીજો કેસ એક જટિલ RiPP પાથવે છે જે 'Ca.જીનસ યુડોરેમિક્રોબિયમ (\(\bar{d}\)MIBiG = 0.46, \(\bar{d}\)RefSeq = 0.33) કુદરતી પ્રોટીન ઉત્પાદનોને એન્કોડ કરવાની આગાહી કરવામાં આવી હતી (ફિગ. 4e).અપેક્ષિત ઘનતા અને પ્રમાણમાં ટૂંકા BGCs45 દ્વારા એન્કોડ કરાયેલ ઉત્સેચકો દ્વારા સ્થાપિત અસામાન્ય રાસાયણિક ફેરફારોની વિવિધતાને કારણે આ માર્ગો ખાસ બાયોટેકનોલોજીકલ રસ ધરાવે છે.અમને જાણવા મળ્યું છે કે આ પ્રોટીન અગાઉના લાક્ષણિક પ્રોટીનથી અલગ છે કારણ કે તેમાં પોલિસેરામાઇડ્સના મુખ્ય NX5N મોટિફ અને લેન્ડોરનામાઇડ્સ 46ના લેન્થિયોનાઇન લૂપ બંનેનો અભાવ છે.સામાન્ય હેટરોલોગસ અભિવ્યક્તિ પેટર્નની મર્યાદાઓને દૂર કરવા માટે, અમે ચાર પરિપક્વ પાથવે એન્ઝાઇમ્સ (પદ્ધતિઓ) ને દર્શાવવા માટે કસ્ટમ માઇક્રોવિર્ગુલા એરોડેનિટ્રિફિકન્સ સિસ્ટમ સાથે તેનો ઉપયોગ કર્યો.MS/MS, આઇસોટોપ લેબલિંગ અને NMR ના સંયોજનનો ઉપયોગ કરીને, અમે પેપ્ટાઇડના 46-એમિનો એસિડ કોરમાં આ પરિપક્વ ઉત્સેચકો શોધી કાઢ્યા (ફિગ. 4f,g, વિસ્તૃત ડેટા, ફિગ. 10-12 અને વધારાની માહિતી).પરિપક્વ ઉત્સેચકોમાં, અમે RiPP પાથવેમાં FkbM O-methyltransferase કુટુંબના સભ્ય 47નું પ્રથમ દેખાવ દર્શાવ્યું અને અણધારી રીતે જાણવા મળ્યું કે આ પરિપક્વ એન્ઝાઇમ બેકબોન N-methylation (ફિગ. 4h, i અને વધારાની માહિતી) નો પરિચય આપે છે.જોકે આ ફેરફાર કુદરતી NRP48 ઉત્પાદનોમાં જાણીતો છે, એમાઈડ બોન્ડ્સનું એન્ઝાઈમેટિક એન-મેથિલેશન એ એક જટિલ પરંતુ બાયોટેકનોલોજીકલ રીતે નોંધપાત્ર પ્રતિક્રિયા49 છે જે અત્યાર સુધી બોરોસીનના RiPP પરિવાર માટે રસ ધરાવે છે.વિશિષ્ટતા 50,51.ઉત્સેચકો અને RiPP ના અન્ય પરિવારોમાં આ પ્રવૃત્તિની ઓળખ નવી એપ્લિકેશનો ખોલી શકે છે અને પ્રોટીન 52 ની કાર્યાત્મક વિવિધતા અને તેમની રાસાયણિક વિવિધતાને વિસ્તૃત કરી શકે છે.ઓળખાયેલ ફેરફારો અને સૂચિત ઉત્પાદન માળખાની અસામાન્ય લંબાઈના આધારે, અમે "પાયથોનામાઇડ" નામનો માર્ગ પ્રસ્તાવિત કરીએ છીએ.
ઉત્સેચકોના વિધેયાત્મક રીતે લાક્ષણિકતા ધરાવતા પરિવારમાં અણધારી એન્ઝાઇમોલોજીની શોધ નવી શોધો માટે પર્યાવરણીય જીનોમિક્સનું વચન દર્શાવે છે, અને માત્ર ક્રમ હોમોલોજીના આધારે કાર્યાત્મક અનુમાન માટે મર્યાદિત ક્ષમતાને પણ દર્શાવે છે.આમ, બિન-કેનોનિકલ બાયોએક્ટિવ પોલીફોસ્ફોરીલેટેડ RiPPs ના અહેવાલો સાથે, અમારા પરિણામો બાયોકેમિકલ સંયોજનોની કાર્યાત્મક સમૃદ્ધિ, વિવિધતા અને અસામાન્ય માળખાને સંપૂર્ણ રીતે ઉજાગર કરવાના કૃત્રિમ જીવવિજ્ઞાનના પ્રયાસો માટે સંસાધન-સઘન પરંતુ નિર્ણાયક મૂલ્ય દર્શાવે છે.
અહીં અમે વૈશ્વિક દરિયાઈ માઇક્રોબાયોમમાં સૂક્ષ્મજીવાણુઓ અને તેમના જીનોમિક સંદર્ભમાં એન્કોડ કરેલી જૈવ-સંશ્લેષણ ક્ષમતાની શ્રેણીનું નિદર્શન કરીએ છીએ, પરિણામી સંસાધનને વૈજ્ઞાનિક સમુદાય (https://microbiomics.io/ocean/) માટે ઉપલબ્ધ કરાવીને ભાવિ સંશોધનની સુવિધા આપીએ છીએ.અમને જાણવા મળ્યું છે કે તેની મોટાભાગની ફાયલોજેનેટિક અને કાર્યાત્મક નવીનતા ફક્ત MAGs અને SAGsનું પુનઃનિર્માણ કરીને જ મેળવી શકાય છે, ખાસ કરીને ઓછા ઉપયોગમાં લેવાયેલા માઇક્રોબાયલ સમુદાયોમાં જે ભવિષ્યના બાયોપ્રોસ્પેક્ટીંગ પ્રયાસોને માર્ગદર્શન આપી શકે છે.જોકે અમે અહીં 'Ca' પર ધ્યાન કેન્દ્રિત કરીશું.Eudormicrobiaceae” વંશ તરીકે ખાસ કરીને બાયોસિન્થેટિકલી “પ્રતિભાશાળી”, વણશોધાયેલ માઇક્રોબાયોટામાં અનુમાન કરાયેલા ઘણા BGC સંભવતઃ અગાઉ વર્ણવેલ એન્ઝાઇમોલોજીને એન્કોડ કરે છે જે પર્યાવરણીય અને/અથવા જૈવ તકનીકી રીતે નોંધપાત્ર ક્રિયાઓ સાથે સંયોજનો આપે છે.
મહાસાગરના તટપ્રદેશમાં, ઊંડા સ્તરોમાં અને સમય જતાં વૈશ્વિક દરિયાઈ માઇક્રોબાયલ સમુદાયોના કવરેજને મહત્તમ કરવા માટે પૂરતા અનુક્રમની ઊંડાઈ સાથે મુખ્ય સમુદ્રશાસ્ત્ર અને સમય શ્રેણીના અભ્યાસોમાંથી મેટાજેનોમિક ડેટાસેટ્સનો સમાવેશ કરવામાં આવ્યો હતો.આ ડેટાસેટ્સ (પૂરક કોષ્ટક 1 અને આકૃતિ 1) માં તારાના મહાસાગરોમાં એકત્રિત કરાયેલા નમૂનાઓમાંથી મેટાજેનોમિક્સનો સમાવેશ થાય છે (વાયરલ સમૃદ્ધ, n=190; પ્રોકાર્યોટિક સમૃદ્ધ, n=180)12,22 અને BioGEOTRACES અભિયાન (n=480).હવાઇયન ઓસેનિક ટાઇમ સિરીઝ (HOT, n = 68), બર્મુડા-એટલાન્ટિક ટાઇમ સિરીઝ (BATS, n = 62)21 અને માલસ્પિના એક્સપિડિશન (n = 58)23.રીડમાંથી સિક્વન્સિંગ એડેપ્ટરોને દૂર કરીને, ગુણવત્તા નિયંત્રણ સિક્વન્સ (PhiX જિનોમ્સ) પર મેપ કરેલા રીડને દૂર કરીને, અને trimq=14, maq=20 નો ઉપયોગ કરીને ગુણવત્તા માટે BBMap (v.38.71) નો ઉપયોગ કરીને ગુણવત્તા માટે ફિલ્ટર કરવામાં આવ્યું હતું. maxns = 0 અને લઘુત્તમ લંબાઈ = 45. અનુગામી વિશ્લેષણ ચલાવવામાં આવ્યા હતા અથવા જો ઉલ્લેખિત હોય તો QC રીડ સાથે મર્જ કરવામાં આવ્યા હતા (bbmerge.sh minoverlap=16).મેટાસ્પેડ્સ (v.3.11.1 અથવા v.3.12 જો જરૂરી હોય તો) 53 નો ઉપયોગ કરીને બિલ્ડ કરતા પહેલા QC રીડિંગ્સ સામાન્ય કરવામાં આવી હતી (bbnorm.sh લક્ષ્ય = 40, માઇન્ડડેપ્થ = 0) 53.પરિણામી સ્કેફોલ્ડ કોન્ટિગ્સ (ત્યારબાદ સ્કેફોલ્ડ્સ તરીકે ઓળખવામાં આવે છે) આખરે લંબાઈ (≥1 kb) દ્વારા ફિલ્ટર કરવામાં આવ્યા હતા.
1038 મેટાજેનોમિક નમૂનાઓને જૂથોમાં વિભાજિત કરવામાં આવ્યા હતા, અને નમૂનાઓના દરેક જૂથ માટે, તમામ નમૂનાઓના મેટાજેનોમિક ગુણવત્તા નિયંત્રણ રીડ દરેક નમૂનાના કૌંસ સાથે અલગથી મેળ ખાતા હતા, પરિણામે નીચેની સંખ્યામાં જોડી પ્રમાણે કૌંસ ધરાવતા જૂથ વાંચે છે: તારા મરીન વાયરસ - સમૃદ્ધ (190×190), પ્રોકેરીયોટ્સ એનરિચ્ડ (180×180), બાયોજીઓટ્રેસ, હોટ અને બેટ્સ (610×610) અને માલાસ્પિના (58×58).મેપિંગ બરોઝ-વ્હીલર-એલાઈનર (BWA) (v.0.7.17-r1188)54 નો ઉપયોગ કરીને કરવામાં આવ્યું હતું જે રીડિંગ્સને ગૌણ સાઇટ્સ (-a ફ્લેગનો ઉપયોગ કરીને) સાથે મેચ કરવાની મંજૂરી આપે છે.સંરેખણને ઓછામાં ઓછા 45 પાયા લાંબા, ≥97% ઓળખ અને સ્પેન ≥80% વાંચવા માટે ફિલ્ટર કરવામાં આવ્યા હતા.પરિણામી BAM ફાઇલો દરેક જૂથ માટે આંતર- અને આંતર-નમૂના કવરેજ પ્રદાન કરવા માટે MetaBAT2 (v.2.12.1)55 માટે jgi_summarize_bam_contig_depths સ્ક્રિપ્ટનો ઉપયોગ કરીને પ્રક્રિયા કરવામાં આવી હતી.છેલ્લે, -minContig 2000 અને -maxEdges 500 સાથેના તમામ નમૂનાઓ પર વ્યક્તિગત રીતે MetaBAT2 ચલાવીને સંવેદનશીલતા વધારવા માટે કૌંસનું જૂથ કરવામાં આવ્યું હતું. અમે એન્સેમ્બલ બોક્સરને બદલે MetaBAT2 નો ઉપયોગ કરીએ છીએ કારણ કે તે સ્વતંત્ર પરીક્ષણોમાં સૌથી અસરકારક સિંગલ બોક્સર તરીકે દર્શાવવામાં આવ્યું છે.અને અન્ય સામાન્ય રીતે ઉપયોગમાં લેવાતા બોક્સર કરતાં 10 થી 50 ગણી ઝડપી 57.વિપુલતાના સહસંબંધોની અસર ચકાસવા માટે, મેટાજેનોમિક્સના રેન્ડમલી પસંદ કરેલ પેટા નમૂના (બે તારા મહાસાગર ડેટાસેટ્સમાંથી પ્રત્યેક માટે 10, બાયોજીઓટ્રેસીસ માટે 10, દરેક સમયની શ્રેણી માટે 5 અને માલાસ્પીના માટે 5) વધારાના નમૂનાઓનો ઉપયોગ કરવામાં આવ્યો હતો.કવરેજ માહિતી મેળવવા માટે આંતરિક નમૂનાઓને જૂથબદ્ધ કરવામાં આવે છે.(વધારાની માહિતી).
અનુગામી વિશ્લેષણમાં વધારાના (બાહ્ય) જીનોમનો સમાવેશ કરવામાં આવ્યો હતો, એટલે કે તારા મહાસાગરો26 ડેટાસેટના સબસેટમાંથી મેન્યુઅલી પસંદ કરાયેલ 830 MAGs, GORG20 ડેટાસેટમાંથી 5287 SAGs, અને MAR ડેટાબેઝ (MarDB v. 4) માંથી ડેટા 1707 REFsol અને છે. 682 SAGs) 27. MarDB ડેટાસેટ માટે, જિનોમ ઉપલબ્ધ મેટાડેટાના આધારે પસંદ કરવામાં આવે છે જો નમૂનાનો પ્રકાર નીચેના રેગ્યુલર એક્સપ્રેશન સાથે મેળ ખાતો હોય: '[S|s]ingle.?[C|c]ell|[C|c]culture| [I|i] અલગ'.
CheckM (v.1.0.13) અને Anvi'o's Lineage Workflow (v.5.5.0)58,59 નો ઉપયોગ કરીને દરેક મેટાજેનોમિક કન્ટેનર અને બાહ્ય જીનોમની ગુણવત્તાનું મૂલ્યાંકન કરવામાં આવ્યું હતું.જો CheckM અથવા Anvi'o ≥50% સંપૂર્ણતા/સંપૂર્ણતા અને ≤10% દૂષણ/રિડન્ડન્સીનો અહેવાલ આપે છે, તો પછીના વિશ્લેષણ માટે મેટાજેનોમિક કોષો અને બાહ્ય જીનોમને સાચવો.આ સ્કોર્સને પછી સામુદાયિક માપદંડ 60 અનુસાર જીનોમની ગુણવત્તાને નીચે પ્રમાણે વર્ગીકૃત કરવા માટે સરેરાશ પૂર્ણતા (mcpl) અને સરેરાશ દૂષણ (mctn) માં જોડવામાં આવ્યા હતા: ઉચ્ચ ગુણવત્તા: mcpl ≥ 90% અને mctn ≤ 5%;સારી ગુણવત્તા: mcpl ≥ 70%, mctn ≤ 10%, મધ્યમ ગુણવત્તા: mcpl ≥ 50% અને mctn ≤ 10%, વાજબી ગુણવત્તા: mcpl ≤ 90% અથવા mctn ≥ 10%.ફિલ્ટર કરેલ જિનોમને પછી ગુણવત્તાના સ્કોર્સ (Q અને Q') સાથે નીચે પ્રમાણે સહસંબંધિત કરવામાં આવ્યા હતા: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (સ્ટ્રેન વેરિએબિલિટી)/100 + 0.5 x log[N50] .(dRep61 માં અમલી).
વિવિધ ડેટા સ્ત્રોતો અને જિનોમ પ્રકારો (MAG, SAG અને REF) વચ્ચે તુલનાત્મક પૃથ્થકરણને મંજૂરી આપવા માટે, dRep (v.2.5.4) નો ઉપયોગ કરીને જીનોમ-વાઇડ એવરેજ ન્યુક્લિયોટાઇડ આઇડેન્ટિટી (ANI) ના આધારે 34,799 જિનોમ ડિરેફરન્સ કરવામાં આવ્યા હતા.પુનરાવર્તન)61 95% ANI થ્રેશોલ્ડ સાથે 28,62 (-comp 0 -con 1000 -sa 0.95 -nc 0.2) અને સિંગલ-કોપી માર્કર જનીનો SpecI63 નો ઉપયોગ કરીને જાતિના સ્તરે જીનોમ ક્લસ્ટરિંગ પ્રદાન કરે છે.ઉપર નિર્ધારિત મહત્તમ ગુણવત્તા સ્કોર (Q') અનુસાર દરેક dRep ક્લસ્ટર માટે એક પ્રતિનિધિ જીનોમ પસંદ કરવામાં આવ્યો હતો, જે પ્રજાતિના પ્રતિનિધિ તરીકે ગણવામાં આવતો હતો.
મેપિંગ ઝડપનું મૂલ્યાંકન કરવા માટે, BWA (v.0.7.17-r1188, -a) નો ઉપયોગ OMD માં સમાવિષ્ટ 34,799 જીનોમ સાથે મેટાજેનોમિક રીડના તમામ 1038 સેટને મેપ કરવા માટે કરવામાં આવ્યો હતો.ગુણવત્તા-નિયંત્રિત રીડ્સને સિંગલ-એન્ડેડ મોડમાં મેપ કરવામાં આવ્યા હતા અને પરિણામી સંરેખણને માત્ર સંરેખણ ≥45 bp લંબાઈ જાળવી રાખવા માટે ફિલ્ટર કરવામાં આવ્યા હતા.અને ઓળખ ≥95%.દરેક નમૂના માટે પ્રદર્શન ગુણોત્તર ગુણવત્તા નિયંત્રણ રીડિંગ્સની કુલ સંખ્યા દ્વારા વિભાજિત ફિલ્ટરેશન પછી બાકી રહેલા વાંચનની ટકાવારી છે.સમાન અભિગમનો ઉપયોગ કરીને, દરેક 1038 મેટાજેનોમને 5 મિલિયન ઇન્સર્ટ્સ (વિસ્તૃત ડેટા, ફિગ. 1c) સુધી ઘટાડવામાં આવ્યા હતા અને OMD અને તમામ GEM16 માં GORG SAG સાથે મેળ ખાતા હતા.GEM16 કેટેલોગમાં દરિયાઈ પાણીમાંથી મેળવેલ MAGsની માત્રા મેટાજેનોમિક સ્ત્રોતોની કીવર્ડ ક્વેરી દ્વારા નક્કી કરવામાં આવી હતી, દરિયાઈ પાણીના નમૂનાઓ પસંદ કરીને (દા.ત., દરિયાઈ કાંપથી વિપરીત).ખાસ કરીને, અમે "પારિસ્થિતિક_શ્રેણી" તરીકે "જળચર" પસંદ કરીએ છીએ, "ઇકોસિસ્ટમ_પ્રકાર" તરીકે "દરિયાઇ" પસંદ કરીએ છીએ, અને "આવાસ"ને "ઊંડા મહાસાગર", "દરિયાઇ", "દરિયાઇ સમુદ્રી", "પેલેજિક મરીન", "મરીન વોટર" તરીકે ફિલ્ટર કરીએ છીએ. "મહાસાગર", "સમુદ્રનું પાણી", "સપાટી સમુદ્રનું પાણી", "સપાટી સમુદ્રનું પાણી".આના પરિણામે 5903 MAGs (734 ઉચ્ચ ગુણવત્તા) 1823 OTUs પર વિતરિત થયા (અહીં જોવાયા).
GTDB r89 સંસ્કરણ 13 ને લક્ષ્યાંકિત કરતા ડિફૉલ્ટ પરિમાણો સાથે GTDB-Tk (v.1.0.2)64 નો ઉપયોગ કરીને પ્રોકાર્યોટિક જિનોમ્સ વર્ગીકરણ રૂપે એનોટેટ કરવામાં આવ્યા હતા. Anvi'o નો ઉપયોગ ડોમેન અનુમાનના આધારે યુકેરીયોટિક જિનોમને ઓળખવા અને ≥50% અને રીડન્ડન્સી%10% રિકોલ કરવા માટે કરવામાં આવ્યો હતો.જાતિનું વર્ગીકરણ એનોટેશન તેના પ્રતિનિધિ જીનોમમાંના એક તરીકે વ્યાખ્યાયિત થયેલ છે.યુકેરીયોટ્સ (148 MAG) ના અપવાદ સાથે, દરેક જીનોમને પ્રથમ પ્રોક્કા (v.1.14.5)65 નો ઉપયોગ કરીને કાર્યાત્મક રીતે ટીકા કરવામાં આવી હતી, સંપૂર્ણ જનીનોનું નામકરણ કરવામાં આવ્યું હતું, જરૂરિયાત મુજબ "આર્કિયા" અથવા "બેક્ટેરિયા" પરિમાણોને વ્યાખ્યાયિત કરવામાં આવ્યા હતા, જે બિન-સંપૂર્ણતા માટે પણ નોંધવામાં આવે છે. કોડિંગ જનીનો.અને CRISPR પ્રદેશો, અન્ય જીનોમિક લક્ષણો વચ્ચે.fetchMG (v.1.2)66 નો ઉપયોગ કરીને યુનિવર્સલ સિંગલ-કોપી માર્કર જનીનો (uscMG) ને ઓળખીને અનુમાનિત જનીનોની ટીકા કરો, એગએનઓજી (v.5.0)68 પર આધારિત એમ્પેપર (v.2.0.1)67 નો ઉપયોગ કરીને ઓર્થોલોગ જૂથો અને ક્વેરી સોંપો.KEGG ડેટાબેઝ (પ્રકાશિત ફેબ્રુઆરી 10, 2020) 69. છેલ્લું પગલું DIAMOND (v.0.9.30)70 નો ઉપયોગ કરીને ≥70% ની ક્વેરી અને વિષય કવરેજનો ઉપયોગ કરીને KEGG ડેટાબેઝ સાથે પ્રોટીનને મેચ કરીને કરવામાં આવ્યું હતું.મહત્તમ અપેક્ષિત બિટરેટના ≥ 50% (લિંક પોતે) બિટરેટ પર આધારિત NCBI પ્રોકાર્યોટિક જીનોમ એનોટેશન પાઇપલાઇન 71 અનુસાર પરિણામોને વધુ ફિલ્ટર કરવામાં આવ્યા હતા.ડિફોલ્ટ પેરામીટર્સ અને વિવિધ ક્લસ્ટર વિસ્ફોટો સાથે antiSMASH (v.5.1.0)72 નો ઉપયોગ કરીને જીનોમમાં BGC ને ઓળખવા માટે જનીન સિક્વન્સનો પણ ઇનપુટ તરીકે ઉપયોગ કરવામાં આવ્યો હતો.વેબ (https://microbiomics.io/ocean/) પર ઉપલબ્ધ સંદર્ભાત્મક મેટાડેટા સાથે તમામ જીનોમ અને ટીકાઓ OMD માં સંકલિત કરવામાં આવ્યા છે.
અગાઉ વર્ણવેલ પદ્ધતિઓની જેમ જ 12,22 અમે CD-HIT (v.4.8.1) નો ઉપયોગ OMD માંથી બેક્ટેરિયલ અને આર્કિયલ જીનોમમાંથી 56.6 મિલિયન પ્રોટીન-કોડિંગ જનીનોને 95% ઓળખ અને ટૂંકા જનીનોમાં (90% કવરેજ) 73 સુધી ક્લસ્ટર કરવા માટે કર્યો હતો. >17.7 મિલિયન જીન ક્લસ્ટરો.દરેક જનીન ક્લસ્ટર માટે સૌથી લાંબો ક્રમ પ્રતિનિધિ જનીન તરીકે પસંદ કરવામાં આવ્યો હતો.ત્યારબાદ 1038 મેટાજેનોમને >17.7 મિલિયન BWA (-a) ક્લસ્ટર સભ્યો સાથે મેચ કરવામાં આવ્યા હતા અને પરિણામી BAM ફાઈલોને માત્ર ≥95% ટકા ઓળખ અને ≥45 બેઝ એલાઈનમેન્ટ સાથે સંરેખણ જાળવી રાખવા માટે ફિલ્ટર કરવામાં આવી હતી.લંબાઈ-સામાન્ય જનીન વિપુલતાની ગણતરી શ્રેષ્ઠ અનન્ય સંરેખણમાંથી પ્રથમ ગણતરીના દાખલો દ્વારા કરવામાં આવી હતી અને પછી, અસ્પષ્ટ-મેપ કરેલ દાખલો માટે, અનુરૂપ લક્ષ્ય જનીનોમાં અપૂર્ણાંક ગણતરીઓ તેમના અનન્ય દાખલની સંખ્યાના પ્રમાણસર ઉમેરીને.
વિસ્તૃત MOTU સંદર્ભ ડેટાબેઝ બનાવવા માટે વિસ્તૃત OMD (“Ca. Eudormicrobiaceae” ના વધારાના MAGs સાથે, નીચે જુઓ) માંથી જીનોમ્સ mOTUs74 મેટાજેનોમિક વિશ્લેષણ સાધન ડેટાબેઝ (v.2.5.1) માં ઉમેરવામાં આવ્યા હતા.દસ uscMGsમાંથી માત્ર છ સિંગલ-કોપી જીનોમ (23,528 જીનોમ) જ બચી શક્યા.ડેટાબેઝના વિસ્તરણને પરિણામે પ્રજાતિના સ્તરે 4,494 વધારાના ક્લસ્ટરો બન્યા.ડિફોલ્ટ એમઓટીયુ પેરામીટર્સ (v.2) નો ઉપયોગ કરીને 1038 મેટાજેનોમ્સનું વિશ્લેષણ કરવામાં આવ્યું હતું.644 એમઓટીયુ ક્લસ્ટરમાં સમાવિષ્ટ કુલ 989 જીનોમ (95% REF, 5% SAG અને 99.9% MarDB સાથે જોડાયેલા) એમઓટીયુ પ્રોફાઇલ દ્વારા શોધવામાં આવ્યા ન હતા.આ MarDB જિનોમના દરિયાઈ અલગતાના વિવિધ વધારાના સ્ત્રોતોને પ્રતિબિંબિત કરે છે (મોટા ભાગના વણશોધાયેલા જિનોમ કાંપ, દરિયાઈ યજમાનો, વગેરેથી અલગ પડેલા જીવો સાથે સંકળાયેલા છે).આ અભ્યાસમાં ખુલ્લા સમુદ્રી વાતાવરણ પર ધ્યાન કેન્દ્રિત કરવાનું ચાલુ રાખવા માટે, અમે તેમને ડાઉનસ્ટ્રીમ વિશ્લેષણમાંથી બાકાત રાખ્યા છે સિવાય કે તેઓ આ અભ્યાસમાં બનાવેલ વિસ્તૃત એમઓટીયુ ડેટાબેઝમાં શોધાયા હોય અથવા શામેલ ન થયા હોય.
OMD (ઉપર જુઓ) માં MAG, SAG અને REF માંથી તમામ BGC ને તમામ મેટાજેનોમિક સ્કેફોલ્ડ્સમાં ઓળખવામાં આવેલ BGCs સાથે જોડવામાં આવ્યા હતા (એન્ટી સ્મેશ v.5.0, ડિફોલ્ટ પરિમાણો) અને બિગ-સ્લાઈસ (v.1.1) (PFAM ડોમેન )75 નો ઉપયોગ કરીને લાક્ષણિકતા ધરાવે છે.આ સુવિધાઓના આધારે, અમે BGCs વચ્ચેના તમામ કોસાઇન અંતરની ગણતરી કરી અને અનુક્રમે 0.2 અને 0.8 ના અંતર થ્રેશોલ્ડનો ઉપયોગ કરીને GCF અને GCC માં તેમને જૂથબદ્ધ કર્યા (મીન લિંક્સ).આ થ્રેશોલ્ડ એ અગાઉ યુક્લિડિયન ડિસ્ટન્સ 75 નો ઉપયોગ કરીને કોસાઇન ડિસ્ટન્સનો ઉપયોગ કરીને થ્રેશોલ્ડનું અનુકૂલન છે, જે મૂળ BiG-SLICE ક્લસ્ટરિંગ વ્યૂહરચના (પૂરક માહિતી)માં કેટલીક ભૂલોને દૂર કરે છે.
BGC ને પછી સ્કેફોલ્ડ્સ પર એન્કોડેડ માત્ર ≥5 kb જાળવવા માટે ફિલ્ટર કરવામાં આવ્યું હતું, જેથી અગાઉ વર્ણવ્યા પ્રમાણે ફ્રેગમેન્ટેશનનું જોખમ ઓછું કરી શકાય16 અને MarDB REFs અને SAGsને 1038 મેટાજેનોમમાં ન મળે (ઉપર જુઓ).આના પરિણામે OMD જીનોમ દ્વારા કુલ 39,055 BGC ને એન્કોડ કરવામાં આવ્યા હતા, જેમાં વધારાના 14,106 મેટાજેનોમિક ટુકડાઓ પર ઓળખવામાં આવ્યા હતા (એટલે ​​કે MAGs માં જોડાયા નથી).આ "મેટાજેનોમિક" BGC નો ઉપયોગ ડેટાબેઝ (પૂરક માહિતી) માં કેપ્ચર ન કરાયેલ દરિયાઈ માઇક્રોબાયોમ બાયોસિન્થેસિસ સંભવિતના પ્રમાણનો અંદાજ કાઢવા માટે કરવામાં આવ્યો હતો.દરેક BGC ને બિગ-SCAPE76 માં વ્યાખ્યાયિત એન્ટી-સ્મેશ અથવા બરછટ ઉત્પાદન શ્રેણીઓ દ્વારા વ્યાખ્યાયિત અનુમાનિત ઉત્પાદન પ્રકારો અનુસાર કાર્યાત્મક રીતે લાક્ષણિકતા આપવામાં આવી હતી.પ્રમાણીકરણમાં નમૂનાના પૂર્વગ્રહને રોકવા માટે (GCC/GCF ની વર્ગીકરણ અને કાર્યાત્મક રચના, GCF અને GCC નું અંતર ડેટાબેસેસ માટે, અને GCF ની મેટાજેનોમિક વિપુલતા), દરેક જાતિઓ માટે GCF દીઠ માત્ર સૌથી લાંબો BGC રાખીને, 39,055 BGC ને આગળ વધારવામાં આવ્યા. પરિણામે કુલ 17,689 BGC.
GCC અને GCF ની નવીનતાનું મૂલ્યાંકન ગણતરી કરેલ ડેટાબેઝ (BiG-FAM માં RefSeq ડેટાબેઝ)29 અને પ્રાયોગિક રીતે ચકાસાયેલ (MIBIG 2.0)30 BGC વચ્ચેના અંતરના આધારે કરવામાં આવ્યું હતું.દરેક 17,689 પ્રતિનિધિ BGC માટે, અમે સંબંધિત ડેટાબેઝ માટે સૌથી નાનું કોસાઇન અંતર પસંદ કર્યું છે.આ લઘુત્તમ અંતર પછી GCF અથવા GCC અનુસાર, યોગ્ય તરીકે સરેરાશ (સરેરાશ) કરવામાં આવે છે.જો ડેટાબેઝનું અંતર 0.2 કરતા વધારે હોય તો GCF ને નવું માનવામાં આવે છે, જે (સરેરાશ) GCF અને સંદર્ભ વચ્ચેના આદર્શ વિભાજનને અનુરૂપ છે.GCC માટે, અમે 0.4 પસંદ કરીએ છીએ, જે GCF દ્વારા વ્યાખ્યાયિત થ્રેશોલ્ડ કરતાં બમણું છે, લિંક્સ સાથે લાંબા ગાળાના સંબંધમાં તાળું મારે છે.
BGC ની મેટાજેનોમિક વિપુલતા એ જનીન-સ્તરની પ્રોફાઇલ્સમાંથી ઉપલબ્ધ તેના બાયોસિન્થેટિક જનીનોની સરેરાશ વિપુલતા (એન્ટિ-SMASH દ્વારા નિર્ધારિત) તરીકે અંદાજવામાં આવી હતી.ત્યારબાદ દરેક GCF અથવા GCC ની મેટાજેનોમિક વિપુલતાની ગણતરી પ્રતિનિધિ BGC ના સરવાળા તરીકે કરવામાં આવી હતી (17,689માંથી).આ વિપુલતા નકશાઓ પછીથી પ્રતિ-નમૂના એમઓટીયુ ગણતરીનો ઉપયોગ કરીને સેલ્યુલર રચના માટે સામાન્ય બનાવવામાં આવ્યા હતા, જે અનુક્રમના પ્રયત્નો માટે પણ જવાબદાર હતા (વિસ્તૃત ડેટા, ફિગ. 1d).GCF અથવા GCC નો વ્યાપ વિપુલતા > 0 સાથેના નમૂનાઓની ટકાવારી તરીકે ગણવામાં આવ્યો હતો.
નમૂનાઓ વચ્ચેના યુક્લિડિયન અંતરની ગણતરી સામાન્ય GCF પ્રોફાઇલમાંથી કરવામાં આવી હતી.આ અંતરો UMAP77 નો ઉપયોગ કરીને કદમાં ઘટાડવામાં આવ્યા હતા અને પરિણામી એમ્બેડિંગ્સનો ઉપયોગ HDBSCAN78 નો ઉપયોગ કરીને અસુરક્ષિત ઘનતા-આધારિત ક્લસ્ટરિંગ માટે કરવામાં આવ્યો હતો.HDBSCAN દ્વારા ઉપયોગમાં લેવાતા ક્લસ્ટર (અને તેથી ક્લસ્ટરની સંખ્યા) માટે પોઈન્ટ્સની શ્રેષ્ઠ લઘુત્તમ સંખ્યા ક્લસ્ટર સભ્યપદની સંચિત સંભાવનાને મહત્તમ કરીને નક્કી કરવામાં આવે છે.ઓળખાયેલ ક્લસ્ટરો (અને આ ક્લસ્ટરોના રેન્ડમ સંતુલિત સબસેમ્પલ પરમ્યુટેશનલ મલ્ટિવેરિયેટ એનાલિસિસ ઓફ વેરિઅન્સ (PERMANOVA) માં પૂર્વગ્રહ માટે જવાબદાર છે) PERMANOVA નો ઉપયોગ કરીને અનિયંત્રિત યુક્લિડિયન અંતર સામે મહત્વ માટે પરીક્ષણ કરવામાં આવ્યું હતું.નમૂનાઓના સરેરાશ જીનોમ કદની ગણતરી એમઓટીયુની સંબંધિત વિપુલતા અને જીનોમના સભ્યોના અંદાજિત જીનોમ કદના આધારે કરવામાં આવી હતી.ખાસ કરીને, દરેક એમઓટીયુના સરેરાશ જિનોમ કદનો અંદાજ તેના સભ્યોના જિનોમ કદની સરેરાશ તરીકે પૂર્ણતા (ફિલ્ટરિંગ પછી) માટે સુધારેલ છે (ઉદાહરણ તરીકે, 3 Mb ની લંબાઈ સાથે 75% સંપૂર્ણ જીનોમ 4 નું સમાયોજિત કદ ધરાવે છે. Mb).અખંડિતતા સાથે મધ્યમ જીનોમ માટે ≥70%.દરેક નમૂના માટે સરેરાશ જીનોમ કદની ગણતરી પછી સાપેક્ષ વિપુલતા દ્વારા ભારિત એમઓટીયુ જીનોમ કદના સરવાળા તરીકે કરવામાં આવી હતી.
OMD માં જીનોમ-એન્કોડેડ BGC નો ફિલ્ટર કરેલ સમૂહ બેક્ટેરિયલ અને આર્કિયલ GTDB વૃક્ષોમાં (≥5 kb ફ્રેમવર્કમાં, REF અને SAG MarDB ને બાદ કરતાં 1038 મેટાજેનોમમાં જોવા મળતો નથી, ઉપર જુઓ) અને તેમના અનુમાનિત ઉત્પાદન કેટેગરીઝમાં દર્શાવવામાં આવ્યા છે. જીનોમની સ્થિતિ (ઉપર જુઓ).અમે પ્રતિનિધિ તરીકે તે પ્રજાતિમાં સૌથી વધુ BGC ધરાવતા જીનોમનો ઉપયોગ કરીને, પ્રજાતિ દ્વારા ડેટાને પ્રથમ ઘટાડી દીધો.વિઝ્યુલાઇઝેશન માટે, પ્રતિનિધિઓને વધુ વૃક્ષ જૂથોમાં વિભાજિત કરવામાં આવ્યા હતા, અને ફરીથી, દરેક કોષીય ક્લેડ માટે, સૌથી વધુ સંખ્યામાં BGC ધરાવતા જીનોમને પ્રતિનિધિ તરીકે પસંદ કરવામાં આવ્યા હતા.BGC-સમૃદ્ધ પ્રજાતિઓ (>15 BGCs સાથેનો ઓછામાં ઓછો એક જિનોમ) તે BGCs માં એન્કોડ કરેલા ઉત્પાદન પ્રકારો માટે શેનોન ડાયવર્સિટી ઇન્ડેક્સની ગણતરી કરીને વધુ વિશ્લેષણ કરવામાં આવ્યું હતું.જો તમામ અનુમાનિત ઉત્પાદન પ્રકારો સમાન હોય, તો રાસાયણિક સંકર અને અન્ય જટિલ BGC (એન્ટિ-SMAH દ્વારા અનુમાન મુજબ) સમાન ઉત્પાદન પ્રકાર સાથે સંબંધિત માનવામાં આવે છે, ક્લસ્ટરમાં તેમના ક્રમને ધ્યાનમાં લીધા વગર (દા.ત. પ્રોટીન-બેક્ટેરિયોસિન અને બેક્ટેરિયોસિન-પ્રોટીઓપ્રોટીન ફ્યુઝન. શરીર).વર્ણસંકર).
માલસ્પિના નમૂના MP1648 માંથી બાકીના DNA (અંદાજિત 6 ng), જૈવિક નમૂના SAMN05421555 ને અનુરૂપ અને ટૂંકા વાંચવા માટે Illumina SRR3962772 મેટાજેનોમિક રીડ સેટ સાથે મેળ ખાય છે, PacBio સિક્વન્સિંગ પ્રોટોકોલ અનુસાર પ્રક્રિયા કરવામાં આવે છે. કીટ (100-980-000) અને SMRTbell એક્સપ્રેસ 2.0 ટેમ્પલેટ તૈયારી કીટ (100-938-900).સંક્ષિપ્તમાં, બાકીના ડીએનએને કોવેરિસ (જી-ટ્યુબ, 52104) નો ઉપયોગ કરીને કાપવામાં, સમારકામ અને શુદ્ધ (પ્રોનેક્સ મણકા) કરવામાં આવ્યું હતું.શુદ્ધ થયેલ ડીએનએ પછી લાઇબ્રેરી તૈયારી, એમ્પ્લીફિકેશન, શુદ્ધિકરણ (પ્રોનેક્સ મણકા) અને કદની પસંદગી (>6 kb, બ્લુ પીપિન) ને અંતિમ શુદ્ધિકરણ પગલું (પ્રોનેક્સ મણકા) અને સિક્વલ II પ્લેટફોર્મ પર અનુક્રમણિકાને આધિન કરવામાં આવે છે.
પ્રથમ બે સીએનું પુનર્નિર્માણ.MAG Eremiobacterota માટે, અમે છ વધારાના ANIs >99% ઓળખ્યા (આ આકૃતિ 3 માં સમાવવામાં આવેલ છે), જે શરૂઆતમાં દૂષણના સ્કોર્સના આધારે ફિલ્ટર કરવામાં આવ્યા હતા (બાદમાં જીન ડુપ્લિકેશન તરીકે ઓળખવામાં આવ્યા હતા, નીચે જુઓ).અમને “Ca” લેબલવાળી ટ્રે પણ મળી.Eremiobacterota” વિવિધ અભ્યાસોમાંથી 23 અને તેનો ઉપયોગ અમારા અભ્યાસમાંથી આઠ MAGs સાથે 633 યુકેરીયોટિક સંવર્ધિત (>0.8 µm) નમૂનાઓમાંથી મેટાજેનોમિક રીડ માટે સંદર્ભ તરીકે BWA (v.0.7.17) Ref -r1188, – એક ધ્વજ)નો ઉપયોગ કરીને ડાઉન સેમ્પલ માટે કર્યો. મેપિંગ (5 મિલિયન વાંચો).સંવર્ધન-વિશિષ્ટ નકશા (95% સંરેખણ ઓળખ અને 80% રીડ કવરેજ દ્વારા ફિલ્ટર કરેલ), એસેમ્બલી માટે 10 મેટાજેનોમ (અપેક્ષિત કવરેજ ≥5×) પસંદ કરવામાં આવ્યા હતા અને સામગ્રી સહસંબંધ માટે વધારાના 49 મેટાજેનોમ (અપેક્ષિત કવરેજ ≥1×) પસંદ કરવામાં આવ્યા હતા.ઉપરોક્ત સમાન પરિમાણોનો ઉપયોગ કરીને, આ નમૂનાઓ બાંધવામાં આવ્યા હતા અને 10 વધારાના 'Ca' ઉમેરવામાં આવ્યા હતા.MAG Eremiobacterota પુનઃસ્થાપિત કરવામાં આવ્યું છે.આ 16 MAG (ડેટાબેઝમાં પહેલાથી જ બેની ગણતરી કરતા નથી) વિસ્તૃત OMDમાં કુલ જિનોમની સંખ્યા 34,815 પર લાવે છે.MAGs ને તેમની જીનોમિક સમાનતા અને GTDB માં સ્થિતિના આધારે વર્ગીકરણ રેન્ક સોંપવામાં આવે છે.18 MAGs dRep નો ઉપયોગ કરીને 5 પ્રજાતિઓ (ઇન્ટ્રાસ્પેસિફિક ANI > 99%) અને 3 જનરા (ઇન્ટ્રાજેનેરિક ANI 85% થી 94%) માં એક જ પરિવારની અંદર 79 ની નકલ કરવામાં આવી હતી.પ્રજાતિના પ્રતિનિધિઓને અખંડિતતા, દૂષણ અને N50ના આધારે મેન્યુઅલી પસંદ કરવામાં આવ્યા હતા.પૂરક માહિતીમાં સૂચિત નામકરણ આપવામાં આવ્યું છે.
'Ca ની અખંડિતતા અને દૂષણનું મૂલ્યાંકન કરો.MAG Eremiobacterota, અમે uscMG ની હાજરીનું મૂલ્યાંકન કર્યું છે, તેમજ વંશ- અને ડોમેન-વિશિષ્ટ સિંગલ-કોપી માર્કર જનીન સેટ ચેકએમ અને એન્વીઓ દ્વારા ઉપયોગમાં લેવાય છે.કોઈપણ સંભવિત દૂષણને નકારી કાઢવા માટે 40 uscMGs માંથી 2 ડુપ્લિકેટની ઓળખ ફિલોજેનેટિક પુનઃનિર્માણ (નીચે જુઓ) દ્વારા પુષ્ટિ કરવામાં આવી હતી (આ 40 માર્કર જનીનોના આધારે 5% ને અનુરૂપ છે).પાંચ પ્રતિનિધિ MAGs 'Ca નો વધારાનો અભ્યાસ.વિપુલતા અને ક્રમ રચના સહસંબંધો (પૂરક માહિતી) 59 પર આધારિત ઇન્ટરેક્ટિવ એન્વિઓ ઇન્ટરફેસનો ઉપયોગ કરીને આ પુનઃનિર્મિત જીનોમમાં દૂષકોના નીચા સ્તરની પુષ્ટિ કરવામાં આવી હતી.
ફિલોજેનોમિક વિશ્લેષણ માટે, અમે પાંચ પ્રતિનિધિ MAGs "Ca" પસંદ કર્યા છે.Eudormicrobiaceae", તમામ જાતિઓ "Ca.Eremiobacterota અને અન્ય ફાયલાના સભ્યો (UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria અને Planctomycetota સહિત)નો જીનોમ GTDB (r89)13 પરથી ઉપલબ્ધ છે.સિંગલ કોપી માર્કર જનીન નિષ્કર્ષણ અને BGC એનોટેશન માટે અગાઉ વર્ણવ્યા મુજબ આ તમામ જિનોમ એનોટેટ કરવામાં આવ્યા હતા.ઉપરોક્ત અખંડિતતા અને દૂષણ માપદંડો અનુસાર જીટીડીબી જીનોમનું સંરક્ષણ કરવામાં આવ્યું હતું.Anvi'o Phylogenetics59 વર્કફ્લોનો ઉપયોગ કરીને ફિલોજેનેટિક વિશ્લેષણ કરવામાં આવ્યું હતું.Anvi'o (MUSCLE, v.3.8.1551)81 દ્વારા ઓળખવામાં આવેલા 39 ટેન્ડમ રિબોસોમલ પ્રોટીનના સંરેખણ પર IQTREE (v.2.0.3) (ડિફોલ્ટ વિકલ્પો અને -bb 1000)80 નો ઉપયોગ કરીને વૃક્ષનું નિર્માણ કરવામાં આવ્યું હતું.તેમના હોદ્દા ઘટાડવામાં આવ્યા હતા.જીનોમ 82 ના ઓછામાં ઓછા 50% ને આવરી લેવા અને GTDB ટ્રી ટોપોલોજી પર આધારિત આઉટગ્રુપ તરીકે પ્લાંક્ટોમીસેકોટાનો ઉપયોગ કરવામાં આવ્યો હતો.40 uscMGs નું એક વૃક્ષ સમાન સાધનો અને પરિમાણોનો ઉપયોગ કરીને બનાવવામાં આવ્યું હતું.
સામાન્ય માઇક્રોબાયલ લક્ષણોની આગાહી કરવા માટે અમે ડિફૉલ્ટ પરિમાણો (ફેનોટાઇપ, ન્યુક્લિયોટાઇડ્સમાંથી) 83 સાથે ટ્રાઇટર (v.1.1.2) નો ઉપયોગ કર્યો.અમે અગાઉ વિકસિત શિકારી ઇન્ડેક્સ84 પર આધારિત સંભવિત શિકારી જીવનશૈલીની શોધ કરી છે જે જીનોમમાં પ્રોટીન-કોડિંગ જનીનની સામગ્રી પર આધારિત છે.ખાસ કરીને, અમે ઓર્થોએમસીએલ ડેટાબેઝ (v.4)85 સામે જીનોમમાં પ્રોટીનની સરખામણી કરવા માટે ડાયમન્ડનો ઉપયોગ કરીએ છીએ -વધુ-સંવેદનશીલ –id 25 –ક્વેરી-કવર 70 –વિષય-કવર 70 –ટોપ 20નો ઉપયોગ કરીને અને અનુરૂપ જનીનોની ગણતરી કરીએ છીએ. શિકારી અને બિન-શિકારી માટે માર્કર જનીનો.ઇન્ડેક્સ એ શિકારી અને બિન-હિંસક નિશાનોની સંખ્યા વચ્ચેનો તફાવત છે.વધારાના નિયંત્રણ તરીકે, અમે "Ca" જીનોમનું પણ વિશ્લેષણ કર્યું.Entotheonella TSY118 પરિબળ Ca સાથેના તેના જોડાણ પર આધારિત છે.યુડોરેમિક્રોબિયમ (મોટા જીનોમ કદ અને બાયોસિન્થેટિક સંભવિત).આગળ, અમે શિકારી અને બિન-શિકારી માર્કર જનીનો અને Ca ની બાયોસિન્થેટિક સંભવિત વચ્ચે સંભવિત લિંક્સનું પરીક્ષણ કર્યું.Eudormicrobiaceae” અને જાણવા મળ્યું કે એક કરતાં વધુ જનીન (કોઈપણ પ્રકારના માર્કર જનીનમાંથી, એટલે કે શિકારી/બિન-શિકારી જનીન) BGC સાથે ઓવરલેપ થતા નથી, જે સૂચવે છે કે BGC શિકારના સંકેતોને ગૂંચવતું નથી.ખાસ કરીને સ્ત્રાવ પ્રણાલી, પિલી અને ફ્લેગેલ્લા 86 ની તપાસ કરવા TXSSCAN (v.1.0.2) નો ઉપયોગ કરીને સ્ક્રેમ્બલ્ડ પ્રતિકૃતિઓની વધારાની જીનોમિક ટીકા કરવામાં આવી હતી.
તારા મહાસાગરોના પ્રોકેરીયોટિક અને યુકેરીયોટિક સંવર્ધન અપૂર્ણાંકો 22,40,87 (BWA, v.0.7.17-r1188, -a ફ્લેગનો ઉપયોગ કરીને) માંથી 623 મેટાટ્રાન્સક્રિપ્ટોમ મેપ કરીને પાંચ પ્રતિનિધિ 'Ca' ને મેપ કરવામાં આવ્યા હતા.યુડોર્માઇક્રોબિયાસી જીનોમ.80% રીડ કવરેજ અને 95% ઓળખ ફિલ્ટરિંગ પછી (વિકલ્પો ફીચરકાઉન્ટ્સ -પ્રાથમિક -ઓ -અપૂર્ણાંક -t CDS,tRNA -F GTF -g ID -p સાથે) BAM ફાઇલો ફીચરકાઉન્ટ્સ (v.2.0.1)88 સાથે પ્રક્રિયા કરવામાં આવી હતી. જનીન દીઠ દાખલની સંખ્યા.જનીન લંબાઈ અને માર્કર જનીન વિપુલતા એમઓટીયુ (સંવર્ધન કાઉન્ટ >0 સાથે જનીનો માટે લંબાઈ-સામાન્ય સરેરાશ નિવેશ ગણતરી) માટે જનરેટ કરેલ નકશા સામાન્ય કરવામાં આવ્યા હતા અને પ્રત્યેક જનીન સ્તરના કોષ દીઠ સંબંધિત અભિવ્યક્તિ મેળવવા માટે 22.74 માં લોગ-રૂપાંતરિત કરવામાં આવ્યા હતા, જે પણ સમજાવે છે. સિક્વન્સિંગ દરમિયાન નમૂનામાંથી નમૂનામાં પરિવર્તનશીલતા.આવા ગુણોત્તર તુલનાત્મક પૃથ્થકરણ માટે પરવાનગી આપે છે, જ્યારે સંબંધિત વિપુલતા ડેટાનો ઉપયોગ કરતી વખતે રચનાની સમસ્યાઓને ઘટાડે છે.10 એમઓટીયુ માર્કર જનીનોમાંથી માત્ર >5 સાથેના નમૂનાઓને વધુ પૃથ્થકરણ માટે ધ્યાનમાં લેવામાં આવ્યા હતા જેથી જીનોમનો પૂરતો મોટો ભાગ શોધી શકાય.
'Ca ની સામાન્યકૃત ટ્રાન્સક્રિપ્ટમ પ્રોફાઇલ.E. taraoceanii ને UMAP નો ઉપયોગ કરીને પરિમાણીયતામાં ઘટાડો કરવામાં આવ્યો હતો અને પરિણામી રજૂઆતનો ઉપયોગ અભિવ્યક્તિની સ્થિતિ નક્કી કરવા માટે HDBSCAN (ઉપર જુઓ) નો ઉપયોગ કરીને દેખરેખ વિનાના ક્લસ્ટરિંગ માટે કરવામાં આવ્યો હતો.PERMANOVA મૂળ (ઘટાયેલ નથી) અંતરની જગ્યામાં ઓળખાયેલા ક્લસ્ટરો વચ્ચેના તફાવતોના મહત્વનું પરીક્ષણ કરે છે.આ સ્થિતિઓ વચ્ચેના વિભેદક અભિવ્યક્તિનું સમગ્ર જીનોમમાં પરીક્ષણ કરવામાં આવ્યું હતું (ઉપર જુઓ) અને 201 KEGG માર્ગો 6 કાર્યાત્મક જૂથોમાં ઓળખવામાં આવ્યા હતા, જેમ કે: BGC, સ્ત્રાવ પ્રણાલી અને TXSSCAN માંથી ફ્લેગેલર જીન્સ, ડિગ્રેડેશન એન્ઝાઇમ્સ (પ્રોટીઝ અને પેપ્ટીડેસેસ), અને શિકારી અને બિન- શિકારી જનીનો.શિકારી ઇન્ડેક્સ માર્કર્સ.દરેક નમૂના માટે, અમે દરેક વર્ગ માટે સરેરાશ સામાન્ય અભિવ્યક્તિની ગણતરી કરી (નોંધ કરો કે BGC અભિવ્યક્તિ પોતે જ તે BGC માટે બાયોસિન્થેટિક જનીનોની મધ્ય અભિવ્યક્તિ તરીકે ગણવામાં આવે છે) અને સમગ્ર રાજ્યોમાં મહત્વ માટે પરીક્ષણ કરવામાં આવ્યું હતું (FDR માટે ક્રુસ્કલ-વાલિસ ટેસ્ટ એડજસ્ટેડ).
સિન્થેટીક જનીન જેનસ્ક્રીપ્ટમાંથી ખરીદવામાં આવ્યા હતા અને પીસીઆર પ્રાઈમર માઈક્રોસિન્થ પાસેથી ખરીદવામાં આવ્યા હતા.ડીએનએ એમ્પ્લીફિકેશન માટે થર્મો ફિશર સાયન્ટિફિકમાંથી ફ્યુઝન પોલિમરેઝનો ઉપયોગ કરવામાં આવ્યો હતો.ડીએનએ શુદ્ધિકરણ માટે માચેરી-નાગેલની ન્યુક્લિયોસ્પિન પ્લાઝમિડ્સ, ન્યુક્લિયોસ્પિન જેલ અને પીસીઆર શુદ્ધિકરણ કીટનો ઉપયોગ કરવામાં આવ્યો હતો.પ્રતિબંધ ઉત્સેચકો અને T4 DNA ligase ન્યૂ ઈંગ્લેન્ડ બાયોલેબ્સ પાસેથી ખરીદવામાં આવ્યા હતા.isopropyl-β-d-1-thiogalactopyranoside (IPTG) (Biosynth) અને 1,4-dithiothreitol (DTT, AppliChem) સિવાયના રસાયણો સિગ્મા-એલ્ડ્રિચ પાસેથી ખરીદવામાં આવ્યા હતા અને વધુ શુદ્ધિકરણ વિના ઉપયોગમાં લેવાયા હતા.એન્ટિબાયોટિક્સ ક્લોરામ્ફેનિકોલ (સીએમ), સ્પેક્ટિનોમાસીન ડાયહાઇડ્રોક્લોરાઇડ (એસએમ), એમ્પીસિલિન (એએમપી), જેન્ટામાસીન (જીટી), અને કાર્બેનિસિલિન (સીબીએન) એપ્લિકેમ પાસેથી ખરીદવામાં આવ્યા હતા.બેક્ટો ટ્રિપ્ટોન અને બેક્ટો યીસ્ટ એક્સટ્રેક્ટ મીડિયા ઘટકો BD બાયોસાયન્સમાંથી ખરીદવામાં આવ્યા હતા.સિક્વન્સિંગ માટે ટ્રિપ્સિન પ્રોમેગા પાસેથી ખરીદવામાં આવ્યું હતું.
એન્ટિ-સ્મેશ અનુમાનિત BGC 75.1 માંથી જીન સિક્વન્સ કાઢવામાં આવ્યા હતા.E. malaspinii (પૂરક માહિતી).
જનીનો embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4), અને embAM (અંતર્જનીન પ્રદેશો સહિત) pUC7 સાથે સમન્વયિત (સન્થેટીક) 5 સાથે સમન્વય વગરના હતા. E માં અભિવ્યક્તિ માટે ઑપ્ટિમાઇઝ કરેલ છે ક્યારે.EmA જનીનને PACYCDuet-1(CmR) અને pCDFDuet-1(SmR) ની પ્રથમ બહુવિધ ક્લોનિંગ સાઇટ (MCS1) માં BamHI અને HindIII ક્લીવેજ સાઇટ્સ સાથે સબક્લોન કરવામાં આવ્યું હતું.એમ્બએમ અને એમ્બમોપ્ટ જનીનો (કોડોન-ઓપ્ટિમાઇઝ) MCS1 pCDFDuet-1(SmR) માં BamHI અને HindIII સાથે સબક્લોન કરવામાં આવ્યા હતા અને pCDFDuet-1(SmR) અને pRSFDuet-1(KanR) (MCS2) ની બીજી બહુવિધ ક્લોનિંગ સાઇટમાં મૂકવામાં આવ્યા હતા. NdeI/ChoI.EmAM કેસેટને PCDFDuet1(SmR) માં BamHI અને HindIII ક્લીવેજ સાઇટ્સ સાથે સબક્લોન કરવામાં આવી હતી.orf3/embI જનીન (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) ઓવરલેપ એક્સ્ટેંશન PCR દ્વારા EmbI_OE_F_NdeI અને EmbI_OE_R_XhoI, પ્રાઈમર્સનો ઉપયોગ કરીને બનાવવામાં આવ્યું હતું, જેનું પાચન Nde-1MB-12137_127-127-જનીન (pcD-11/127) દ્વારા કરવામાં આવ્યું હતું. ) સમાન પ્રતિબંધ ઉત્સેચકોનો ઉપયોગ કરીને (પૂરક ટેબલ).6).ઉત્પાદકના પ્રોટોકોલ (ન્યૂ ઈંગ્લેન્ડ બાયોલેબ્સ) અનુસાર પ્રતિબંધ એન્ઝાઇમ પાચન અને બંધન કરવામાં આવ્યું હતું.

 


પોસ્ટ સમય: માર્ચ-14-2023