Generative AI for Science

J. Paul Liu

This is a sample of the book's content.Buy on Leanpub

Table of Contents

Generative AI for Science

From the Author
Chapter 1 — Generative AI: A New Frontier for Scientific Discovery
Chapter 2: Generative AI Fundamentals
Chapter 3: Scientific Data & Workflows
Chapter 4: Text, Code & Knowledge Generation for Scientists
Chapter 5: Data-to-Data Models
Chapter 6: Physics-Informed AI and Simulation
Chapter 7: Domain Applications in Chemistry, Biology, Physics and Geoscience
Chapter 8: Fine-Tuning & Domain Adaptation
Chapter 9: Multimodal Generative AI for Sciences
Chapter 10: Evaluation, Validation & Benchmarking
Chapter 11: Ethics & Responsible AI for Science
Chapter 12: Deployment & MLOps for Scientific Applications
Chapter 13: Future Directions & Conclusion
Acknowledgements

Generative AI for Science/Chapter 9: Multimodal Generative AI for Sciences

Chapter 9: Multimodal Generative AI for Sciences

https://leanpub.com/generativeaiforscience

Introduction: Beyond Single-Modality AI

https://leanpub.com/generativeaiforscience

The Road to Multimodal AI: A Progressive View

https://leanpub.com/generativeaiforscience

Era 1: Transfer Learning from Natural Images (2012–2018)

https://leanpub.com/generativeaiforscience

Era 2: Domain-Specific Self-Supervised Learning (2019–2022)

https://leanpub.com/generativeaiforscience

Era 3: Vision-Language Alignment (2021–Present)

https://leanpub.com/generativeaiforscience

CONCH: A Concrete Example

https://leanpub.com/generativeaiforscience

Why This Progression Matters

https://leanpub.com/generativeaiforscience

Part I: Vision-Language Models for Science

https://leanpub.com/generativeaiforscience

The Challenge of Scientific Images

https://leanpub.com/generativeaiforscience

Scientific Image-Text Model

https://leanpub.com/generativeaiforscience

Zero-Shot Scientific Image Classification

https://leanpub.com/generativeaiforscience

Visual Question Answering for Lab Images

https://leanpub.com/generativeaiforscience

Part II: Graph-Text Models for Molecules

https://leanpub.com/generativeaiforscience

Molecular Graphs as Structured Data

https://leanpub.com/generativeaiforscience

Multimodal Molecular Model

https://leanpub.com/generativeaiforscience

Applications: Text-Based Molecular Retrieval

https://leanpub.com/generativeaiforscience

Part III: Time Series with Textual Context

https://leanpub.com/generativeaiforscience

Contextualizing Sensor Data

https://leanpub.com/generativeaiforscience

Multimodal Time Series Model

https://leanpub.com/generativeaiforscience

Validating Multimodal Learning: Ablation Studies

https://leanpub.com/generativeaiforscience

Designing Tasks with Cross-Modal Dependencies

https://leanpub.com/generativeaiforscience

Part IV: Multimodal Fusion Architectures

https://leanpub.com/generativeaiforscience

Cross-Modal Attention Mechanisms

https://leanpub.com/generativeaiforscience

Early vs Late vs Attention Fusion

https://leanpub.com/generativeaiforscience

Part V: Scientific Document Understanding

https://leanpub.com/generativeaiforscience

Extracting Knowledge from Papers

https://leanpub.com/generativeaiforscience

Part VI: Training Multimodal Scientific Models

https://leanpub.com/generativeaiforscience

Self-Supervised Pretraining

https://leanpub.com/generativeaiforscience

Domain-Specific Fine-Tuning

https://leanpub.com/generativeaiforscience

Part VII: Practical Applications

https://leanpub.com/generativeaiforscience

Application 1: Automated Lab Documentation

https://leanpub.com/generativeaiforscience

Application 2: Cross-Modal Molecular Search

https://leanpub.com/generativeaiforscience

Application 3: Text-Conditional Molecule Generation

https://leanpub.com/generativeaiforscience

Laboratory Automation with Multimodal Integration

https://leanpub.com/generativeaiforscience

Summary

https://leanpub.com/generativeaiforscience

References

https://leanpub.com/generativeaiforscience

Additional Resources

https://leanpub.com/generativeaiforscience

Up next

Chapter 10: Evaluation, Validation & Benchmarking

In this chapter

Chapter 9: Multimodal Generative AI for Sciences
Introduction: Beyond Single-Modality AI
Part I: Vision-Language Models for Science
Part II: Graph-Text Models for Molecules
Part III: Time Series with Textual Context
Part IV: Multimodal Fusion Architectures
Part V: Scientific Document Understanding
Part VI: Training Multimodal Scientific Models
Part VII: Practical Applications
Summary
References