Add llama converter (no dependency on internal Nvidia code) - part 1/2 by danielkorzekwa · Pull Request #545 · NVIDIA/Model-Optimizer

danielkorzekwa · 2025-11-12T09:06:28Z

What does this PR do?

Add llama converter (no dependency on internal Nvidia code) - part 1/2

change top-level dependencies in convert_llama3_to_decilm.py from puzzle_tools.... to modelopt.....
added modelopt.torch._compress.tools module
remove tokenization_mistral.py - not used

scope of 2/2 part (will come once part 1/2 is merged):

change all deeper dependencies from from puzzle_tools.... to modelopt....
test_convert_llama3_config_to_decilm_config.py should run without any internal nvidia dependencies

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

…ntained Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

kevalmorabia97 · 2025-11-12T09:16:09Z

modelopt/torch/_compress/tools/checkpoint_utils_hf.py

+from puzzle_tools import deci_lm_hf_code
+from puzzle_tools.common import infer_weights_dtype
+from puzzle_tools.deci_lm_hf_code.configuration_decilm import DeciLMConfig
+from puzzle_tools.deci_lm_hf_code.modeling_decilm import DeciLMForCausalLM
+from puzzle_tools.robust_json import json_dumps
+from safetensors.torch import save_file as safe_save_file
+from transformers.utils import SAFE_WEIGHTS_INDEX_NAME
+from utils.post_init_sparse import SparsityMethod


decilm imports need to be fixed to modelopt path

this is done in 2/2, see scope of 1/2 in MR description.

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

codecov · 2025-11-12T09:28:51Z

Codecov Report

✅ All modified and coverable lines are covered by tests.
✅ Project coverage is 73.40%. Comparing base (50a580c) to head (13ad9d6).
⚠️ Report is 1 commits behind head on feature/compress.

Additional details and impacted files

@@                Coverage Diff                @@
##           feature/compress     #545   +/-   ##
=================================================
  Coverage             73.40%   73.40%           
=================================================
  Files                   180      180           
  Lines                 18127    18127           
=================================================
  Hits                  13306    13306           
  Misses                 4821     4821

☔ View full report in Codecov by Sentry.
📢 Have feedback on the report? Share it here.

🚀 New features to boost your workflow:

❄️ Test Analytics: Detect flaky tests, report on failures, and find test suite problems.

…ntained Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

danielkorzekwa added 17 commits November 3, 2025 21:05

Add decilm modelling code

694c317

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add decilm modelling code.

991659f

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add transformers codebase

8489cee

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add transformers code

f0afefe

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add decilm modelling code

b3ed5bc

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add decilm modelling code

a700da5

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Correct licence headers

b59b679

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Correct licence headers

1abdf3e

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add decilm code

66609b1

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add decilm code

7da0a8a

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add decilm code

6e09a81

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add decilm code

2e3f5da

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add decilm code

418890e

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Make llama3 converter self-contained (no deps on internal Nvidia code)

01f4fc1

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Add common module

c57eed4

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

module refactoring

3dc37b3

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

Merge branch 'feature/compress' into dkorzekwa/llama_converter_selfco…

ccdbdac

…ntained Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

danielkorzekwa requested a review from a team as a code owner November 12, 2025 09:06

kevalmorabia97 reviewed Nov 12, 2025

View reviewed changes

Remove tokenization_mistral ( not used)

4b98873

Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

kevalmorabia97 approved these changes Nov 13, 2025

View reviewed changes

Merge branch 'feature/compress' into dkorzekwa/llama_converter_selfco…

13ad9d6

…ntained Signed-off-by: Daniel Korzekwa <dkorzekwa@nvidia.com>

danielkorzekwa merged commit b121945 into feature/compress Nov 13, 2025
20 of 21 checks passed

danielkorzekwa deleted the dkorzekwa/llama_converter_selfcontained branch November 13, 2025 16:50

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add llama converter (no dependency on internal Nvidia code) - part 1/2#545

Add llama converter (no dependency on internal Nvidia code) - part 1/2#545
danielkorzekwa merged 19 commits intofeature/compressfrom
dkorzekwa/llama_converter_selfcontained

danielkorzekwa commented Nov 12, 2025 •

edited

Loading

Uh oh!

kevalmorabia97 Nov 12, 2025

Uh oh!

danielkorzekwa Nov 12, 2025 •

edited

Loading

Uh oh!

codecov bot commented Nov 12, 2025 •

edited

Loading

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Conversation

danielkorzekwa commented Nov 12, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

What does this PR do?

Uh oh!

kevalmorabia97 Nov 12, 2025

Choose a reason for hiding this comment

Uh oh!

danielkorzekwa Nov 12, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Choose a reason for hiding this comment

Uh oh!

codecov bot commented Nov 12, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Codecov Report

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

danielkorzekwa commented Nov 12, 2025 •

edited

Loading

danielkorzekwa Nov 12, 2025 •

edited

Loading

codecov bot commented Nov 12, 2025 •

edited

Loading