Advancing Solvent Development for CO2 Capture with Deep Learning
Master thesis
Permanent lenke
https://hdl.handle.net/11250/3160923Utgivelsesdato
2024Metadata
Vis full innførselSamlinger
Sammendrag
Målet med denne oppgaven er å kombinere tradisjonelle kjemitekniske metoder med avanserte maskinlæringsteknikker. Tradisjonelle metoder innen kjemiteknikk, som Antoines likning for damptrykk og NRTL-modellen for aktivitetskoeffisienter, er utarbeidet fra laboratorieeksperimenter og teoretisk fysikk. Disse modellene har blitt validert gjennom flere tiår med forskning og er forankret i vår grunnleggende forståelse av termodynamikk og molekylære interaksjoner. Imidlertid har de tradisjonelle metodene en svakhet: de krever ofte spesifikke parametere som ikke er tilgjengelige for nye eller dårlig karakteriserte stoffer.
Maskinlæring utmerker seg ved å gjenkjenne mønstre og finne komplekse, ikke-lineære sammenhenger i data, noe som gjør det mulig å forutsi egenskaper for molekyler den aldri har sett før. Dette er spesielt nyttig for å estimere egenskaper som damptrykk for nye og dårlig karakteriserte stoffer med lite eksperimentell data tilgjengelig. Imidlertid mangler maskinlæringsmodeller ofte en grunnleggende forståelse av de fysiske fenomenene de forsøker å forutsi, noe som kan føre til fysisk umulige prediksjoner, som negativt trykk. For å løse dette problemet vil denne oppgaven fokusere på å utvikle domeneforsterkede nevrale nettverk som bruker grafiske nevrale nettverk for å analysere molekylstrukturen. Ved å kombinere maskinlæringens datadrevne evne med grunnleggende forståelse av kjemiteknikk, kan modellen tvinges til å gi termodynamisk pålitelige prediksjoner.
I dette arbeidet ble det utviklet en modell for å forutsi damptrykket til aminer. Først ble modellen trent på et datasett med et bredt spekter av stoffer, og deretter finjustert spesifikt for aminer. Modellen oppnådde en rot-middel-kvadrat-feil på 0.221 log(mmHg), der 90% av residualene var mellom -0.31 log(mmHg) og 0.36 log(mmHg). Denne spesialiserte aminmodellen presterte betydelig bedre enn modellen den ble sammenlignet med, noe som understreker verdien av modellen utviklet i dette arbeidet.
Videre ble damptrykksmodellen utvidet for å skulle forutsi væske-damp-likevekten for vandige aminer. Denne utvidede modellen oppnådde en rot-middel-kvadrat-feil på 1.125 for prediksjon av aminenes dampfraksjon og 0.136 for prediksjon av de korresponderende vannfraksjonene. For aminfraksjonene lå 90% av residualene innenfor området -1.86 til 1.76, og -0.17 til 0.27 for vannfraksjonen. Feilene er gitt som den naturlige logaritmen av dampfraksjonene. På grunn av mangel på offentlig tilgjengelige modeller som kan forutsi VLE-data basert på molekylstrukturer, ble ingen egnet modell funnet for sammenligning. Dette understreker behovet for videre utvikling av robuste og pålitelige modeller innenfor dette feltet. Modellen utviklet i dette arbeidet kan brukes som et grunnlag for sammenligning i fremtidig forskning på dette feltet. Selv om både damptrykksmodellen og VLE-modellen har potensial for forbedring i nøyaktighet og pålitelighet, demonstrerer dette arbeidet at maskinlæring kan brukes for å beskrive det komplekse forholdet mellom faseadferd og molekylstrukturer. This thesis aims to combine traditional chemical engineering methods with advanced machine learning techniques. Traditional chemical engineering models, such as the Antoine equation for vapor pressure and the NRTL activity coefficient model, are derived from laboratory experiments and theoretical physics. These models have been validated over decades of research and are deeply rooted in our fundamental understanding of thermodynamics and molecular interactions. However, traditional methods often require specific parameters that are not available for new or poorly characterized compounds.
In contrast, machine learning excels at pattern recognition and finding complex, non-linear relationships in data, allowing it to generate predictions for molecules it has never seen before. This capability is valuable for estimating properties, such as the vapor pressure, for new and poorly characterized compounds where experimental data is scarce. However, machine learning models often lack a fundamental grounding in the physical phenomena they aim to predict, which can result in physically impossible predictions, such as negative vapor pressures. To address this, this thesis focuses on developing domain-reinforced neural networks that utilize graph neural networks to analyze the molecular structure. By integrating the robust, data-driven capabilities of machine learning with the fundamental understanding of traditional chemical engineering, this approach constrains the model and ensures it makes thermodynamically consistent predictions.
In this work, a model predicting the saturation pressure of amines was developed by first training on a diverse range of compounds and then fine-tuning it specifically for amines. The model achieved a root mean square error (RMSE) of 0.221 log(mmHg), with 90% of the residuals ranging from -0.31 to 0.36 log(mmHg). This specialized amine model significantly outperformed the model it was benchmarked against, highlighting the value of the model developed in this work.
Furthermore, the saturation pressure model was extended to create a framework for predicting the VLE of aqueous amines. This model achieved a RMSE of 1.125 for predicting the amine vapor fraction and 0.136 for predicting the water fraction, with 90% of the residuals falling within the range of -1.86 to 1.76 for the amine fraction and -0.17 to 0.27 for the water fraction. These errors are given as the natural logarithm of the vapor fractions. Due to the lack of publicly available models for predicting VLE data based on molecular structures, no suitable model was found to benchmark against. This highlights the need for further development of robust and reliable models within this field. The model developed in this thesis could be used as a foundation for future research comparisons. Although both the volatility and VLE model could be further refined to enhance accuracy and reliability, this work demonstrates that machine learning can indeed be used to capture the complex relationship between phase behavior and molecular structures.