llama converter is self-contained now (no dependency on internal nvidia code) by danielkorzekwa · Pull Request #552 · NVIDIA/Model-Optimizer

danielkorzekwa · 2025-11-13T17:03:21Z

What does this PR do?

llama converter is self-contained now (no dependency on internal nvidia code)

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

…ntained_2 Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

codecov · 2025-11-13T17:17:50Z

Codecov Report

✅ All modified and coverable lines are covered by tests.
✅ Project coverage is 73.40%. Comparing base (b121945) to head (298050d).
⚠️ Report is 1 commits behind head on feature/compress.

Additional details and impacted files

@@                Coverage Diff                @@
##           feature/compress     #552   +/-   ##
=================================================
  Coverage             73.40%   73.40%           
=================================================
  Files                   180      180           
  Lines                 18127    18127           
=================================================
  Hits                  13306    13306           
  Misses                 4821     4821

☔ View full report in Codecov by Sentry.
📢 Have feedback on the report? Share it here.

🚀 New features to boost your workflow:

❄️ Test Analytics: Detect flaky tests, report on failures, and find test suite problems.

modelopt/torch/_compress/tools/post_init_sparse.py

modelopt/torch/_compress/tools/sharded_checkpoint_utils.py

kevalmorabia97 · 2025-11-13T19:47:57Z

modelopt/torch/_compress/tools/sharded_checkpoint_utils.py

Is this for pipeline parallel ckpt load and saving? Can you add a short one-line docstring to each file (after license headers) describing what it is about?

So not just for PP but also for DDP?

I do not know which parallelisms are used and how precisely.

tests/experimental/torch/_compress/compress_test_utils.py

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

… (it will run on CI now) Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

kevalmorabia97 · 2025-11-14T09:33:38Z

modelopt/torch/_compress/tools/checkpoint_utils.py

Not for this PR, but do you think it would be better to move this in the DeciLM folder?

Maybe. Actually, initially I moved it to DeciLM but then I realized in how many places it is used. Also not all logic is DeciLM specific. Given that we plan to refactor DeciLM (or even remove) it, I think it is bad timing.

modelopt/torch/_compress/tools/robust_json.py

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

AAnoosheh · 2025-11-14T15:56:58Z

Can confirm conversion of Llama-3.2 worked

danielkorzekwa added 25 commits November 3, 2025 21:05

Add decilm modelling code

694c317

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add decilm modelling code.

991659f

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add transformers codebase

8489cee

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add transformers code

f0afefe

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add decilm modelling code

b3ed5bc

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add decilm modelling code

a700da5

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Correct licence headers

b59b679

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Correct licence headers

1abdf3e

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add decilm code

66609b1

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add decilm code

7da0a8a

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add decilm code

6e09a81

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add decilm code

2e3f5da

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add decilm code

418890e

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Make llama3 converter self-contained (no deps on internal Nvidia code)

01f4fc1

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add common module

c57eed4

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

module refactoring

3dc37b3

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

refactoring

10ffdfe

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

add shared_checkpointing_utils

27a4456

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add json tools

b0e22b7

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

add logger

52e7827

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

import refactoring

f5c1c87

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

add post_init_sparse module

0aa6320

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add post_init_sparse

35d0dbc

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

merginy hydra.py and hydra_utils.py

e39a1ad

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Merge branch 'feature/compress' into dkorzekwa/llama_converter_selfco…

3f0772b

…ntained_2 Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

danielkorzekwa requested a review from a team as a code owner November 13, 2025 17:03

Delete not used tokenizer

872d6c3

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

kevalmorabia97 reviewed Nov 13, 2025

View reviewed changes

Refactor imports

eb60a1c

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

danielkorzekwa added 3 commits November 14, 2025 09:44

Improve comments + move llama convert pytest from experimental to gpu…

c1533fa

… (it will run on CI now) Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

fix broken integration test

763a4d5

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Improve pydocs

76df47c

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

kevalmorabia97 reviewed Nov 14, 2025

View reviewed changes

modelopt/torch/_compress/tools/robust_json.py Outdated Show resolved Hide resolved

Remove try except around import omegaconf

298050d

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

kevalmorabia97 approved these changes Nov 14, 2025

View reviewed changes

danielkorzekwa merged commit 866e400 into feature/compress Nov 14, 2025
20 of 21 checks passed

danielkorzekwa deleted the dkorzekwa/llama_converter_selfcontained_2 branch November 14, 2025 18:03

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

llama converter is self-contained now (no dependency on internal nvidia code)#552

llama converter is self-contained now (no dependency on internal nvidia code)#552
danielkorzekwa merged 31 commits intofeature/compressfrom
dkorzekwa/llama_converter_selfcontained_2

danielkorzekwa commented Nov 13, 2025

Uh oh!

codecov bot commented Nov 13, 2025 •

edited

Loading

Uh oh!

Uh oh!

Uh oh!

kevalmorabia97 Nov 13, 2025

Uh oh!

danielkorzekwa Nov 14, 2025

Uh oh!

kevalmorabia97 Nov 14, 2025

Uh oh!

danielkorzekwa Nov 14, 2025

Uh oh!

Uh oh!

kevalmorabia97 Nov 14, 2025

Uh oh!

danielkorzekwa Nov 14, 2025

Uh oh!

Uh oh!

AAnoosheh commented Nov 14, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Conversation

danielkorzekwa commented Nov 13, 2025

What does this PR do?

Uh oh!

codecov bot commented Nov 13, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Codecov Report

Uh oh!

Uh oh!

Uh oh!

kevalmorabia97 Nov 13, 2025

Choose a reason for hiding this comment

Uh oh!

danielkorzekwa Nov 14, 2025

Choose a reason for hiding this comment

Uh oh!

kevalmorabia97 Nov 14, 2025

Choose a reason for hiding this comment

Uh oh!

danielkorzekwa Nov 14, 2025

Choose a reason for hiding this comment

Uh oh!

Uh oh!

kevalmorabia97 Nov 14, 2025

Choose a reason for hiding this comment

Uh oh!

danielkorzekwa Nov 14, 2025

Choose a reason for hiding this comment

Uh oh!

Uh oh!

AAnoosheh commented Nov 14, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

codecov bot commented Nov 13, 2025 •

edited

Loading